spinny:~/writing $ less agentic-infrastructure-stack.md
12لقد تحدثنا كثيرًا عن الأطر الفاعلية. LangGraph، CrewAI، AutoGen، مجموعات SDK المتنوعة، الحلقة، استدعاء الأدوات، الذاكرة، المخطط، الناقد، المشرف. كل الكلام المفيد جزاكم الله خيرا. لكن كلما نظرت إلى العوامل المستخدمة فعليًا، بدا لي أن الجزء المثير للاهتمام قد انتقل إلى ما دون مستوى إطار العمل.34لم يعد السؤال مجرد: ما هي المكتبة التي أستخدمها لجعل النموذج المرحلي يفكر؟56السؤال الحقيقي هو: أين يعيش هذا العميل عندما يتوقف عن كونه تجريبيًا؟78لأن الوكيل الجاد ليس وظيفة تستدعي النموذج وترجع النص. إنه نظام موزع صغير. يجب عليه قراءة السياق، واستخدام الأدوات، وتنفيذ التعليمات البرمجية، ولمس الملفات، وتذكر القرارات، وطلب الإذن، والفشل بشكل جيد، وإعادة التشغيل، وترك السجلات، وعدم حرق الميزانية وعدم التحول إلى جرافة داخل مستودع الإنتاج.910الإطار هو عجلة القيادة. البنية التحتية هي الطريق والفرامل والجراج والتأمين والشخص الذي يعرف مكان المفاتيح.1112##لأن هناك الكثير من الحديث عنه الآن1314في عامي 2023 و2024، كانت المحادثة تتمحور حول النماذج بشكل كبير. أي ماجستير؟ كم السياق؟ كم يكلف؟ ما مدى براعته في البرمجة؟1516وفي عامي 2025 و2026، تغير الحديث. النماذج جيدة بما فيه الكفاية للقيام بعمل حقيقي، ولكن هذا هو السبب في أن الأجزاء المملة تصبح مرئية: وقت التشغيل، والأمن، والموصلات، والهوية، وقابلية المراقبة، وتنفيذ التعليمات البرمجية، والنشر، والتراجع.1718إنه الانتقال الطبيعي من السحر إلى الهندسة.1920عندما يحتاج الوكيل فقط إلى إنشاء استجابة، تكون الدردشة كافية. عندما تحتاج إلى فتح طلب سحب، والاستعلام عن قاعدة بيانات، واستدعاء CRM، وبدء مهمة، والتنقل في موقع، وقراءة Slack، وتجميع التعليمات البرمجية وتحديث مستند، فأنت بحاجة إلى نظام تشغيل من حوله.2122ليس بالمعنى الحرفي. بالمعنى التنظيمي.2324## القطعة الأولى: وقت تشغيل حيث يمكن للوكيل أن يستمر2526غالبًا ما يعمل الوكيل في خطوات. انظر إلى الحالة، اختر إجراءً، استخدم أداة، راقب النتيجة، قم بتحديث الخطة، كرر.2728إذا كانت هذه الحلقة موجودة داخل طلب HTTP واحد، فستواجه مشكلة على الفور. بعض الإجراءات بطيئة. البعض ينتظر المدخلات البشرية. البعض يفشل ويجب المحاولة مرة أخرى. يجب أن ينجو البعض من النشر أو المهلة.2930هذا هو المكان الذي تلعب فيه مسارات العمل الدائمة وقوائم الانتظار وخلفيات الوظائف وأجهزة الحالة دورها. إنها ليست ساحرة، لكنها تمثل الفارق بين الوكيل الذي يبدو ذكيًا في العرض التجريبي والوكيل الذي يمكنك ترك العمل أثناء ذهابك لتناول القهوة.3132بالنسبة لي، يجب أن يجيب وقت التشغيل الوكيل على أسئلة محددة للغاية:3334- أين أحفظ الحالة بين خطوة وأخرى؟35- ماذا يحدث إذا ماتت العملية في منتصف الطريق؟36- هل يمكنني التوقف وطلب الموافقة؟37- هل يمكنني إعادة تشغيل الجولة لأفهم سبب قيامه بهذا الاختيار؟38- هل يمكنني تحديد المدة والذاكرة والأدوات والتكلفة؟3940تعمل شركة Vercel بقوة على هذه الجبهة من خلال مجموعات SDK للذكاء الاصطناعي والوظائف وسير العمل والأدوات اللازمة لبناء الوكلاء داخل تطبيقات الويب. ولكن النقطة ليست مجرد Vercel. النقطة المهمة هي أن الوكيل يحتاج إلى منزل تشغيلي، وليس نقطة نهاية واحدة.4142##القطعة الثانية: صندوق الرمل، لأن الوكيل يجب أن يكون قادراً على الاتساخ دون أن ينكسر4344بمجرد قيام الوكيل بكتابة التعليمات البرمجية أو تنفيذ الأوامر، تكون هناك حاجة إلى وضع الحماية.4546قد تبدو كلمة فنية، لكن الفكرة محلية: أعطه طاولة عمل. يمكنه فتح الملفات وتثبيت التبعيات وإجراء الاختبارات وإجراء التجارب وإنشاء المخرجات. إذا أخطأ في الأمر، فقد احتوت الضرر. إذا كان يعمل، تعزيز النتيجة.4748يجب أن يتمتع صندوق الحماية الوكيل ببعض الخصائص:4950- نظام الملفات المعزولة؛51- حدود وحدة المعالجة المركزية والذاكرة والوقت؛52- شبكة تسيطر عليها؛53- الأسرار محمولة فقط عند الحاجة إليها؛54- سجلات كاملة.55- إمكانية تصدير التحف.56- إعادة ضبط نظيفة بين عمليات التشغيل، عند الضرورة.5758يسير Vercel Sandbox في هذا الاتجاه تمامًا: بيئات معزولة لتشغيل التعليمات البرمجية وتثبيت التبعيات والعمل مع الملفات وإنتاج العناصر دون تشغيل كل شيء في وقت تشغيل التطبيق الرئيسي.5960هذا الشيء أكثر أهمية مما يبدو. تقفز العديد من النماذج الأولية مباشرة من النموذج إلى النظام الحقيقي. يمكن للنموذج استدعاء الأداة. الأدوات يمكن أن تفعل الأشياء. يبدو كل شيء أنيقًا حتى أول أمر خاطئ، وأول تبعية مثبتة في المكان الخطأ، وأول رمز مميز ينتهي به الأمر في السجل.6162صندوق الرمل هو طريقة البالغين للقول: تفضل، ولكن هنا.6364##القطعة الثالثة: MCP ومشكلة الموصل6566أصبح بروتوكول السياق النموذجي أحد الأجزاء الأكثر إثارة للاهتمام في النظام البيئي لأنه يحاول توحيد شيء يصبح بسرعة غير قابل للإدارة: كيف يكتشف النموذج الأدوات الخارجية ويستخدمها.6768وبدون معيار، يصبح كل تكامل بمثابة جزيرة صغيرة. تم إجراء موصل لـ GitHub بطريقة واحدة، وواحد لـ Slack بطريقة أخرى، وواحد لقواعد البيانات ذات دلالات مختلفة، وواحد لأتمتة المتصفح الذي لا يبدو وكأنه شيء.6970يقترح MCP لغة مشتركة بين العميل والخادم: الأدوات والموارد والمطالبات والتراخيص والنقل والاكتشاف. إنه لا يحل مشكلة الحكم والأمن بطريقة سحرية، ولكنه يقدم قواعد نحوية.7172والمسائل النحوية. عندما يتمكن الوكيل من الاتصال بالعديد من الأدوات، فإن السؤال ليس فقط "هل يمكنه القيام بذلك؟". المشكلة هي «هل يفهم ماذا يستطيع أن يفعل، وبأي حدود، ونيابة عن من، وأي أثر يترك؟».7374بالنسبة لي، فإن MCP ليس ضجيجًا لأنه "يقوم باستدعاء الأداة". لقد فعلنا ذلك بالفعل. إنه ضجيج لأنه يحول مركز الثقل من التكامل الفردي إلى كتالوج الأدوات التشغيلية.7576في بنية وكيلة جيدة، يصبح MCP نوعًا من لوحة التصحيح:7778- GitHub للتعليمات البرمجية والمشكلات؛79- الركود لسياق المحادثة.80- الخطي أو جيرا للعمل المخطط؛81- قاعدة بيانات للقراءة فقط للتحليلات؛82- متصفح أو مكشطة يتم التحكم فيها للمواقع الخارجية؛83- تخزين المستندات؛84- بيئات التنفيذ المعزولة؛85- الأنظمة الداخلية مكشوفة بأذونات صارمة.8687الجزء الصعب هو أن كتالوج الأدوات الخالية من السياسات هو مجرد وسيلة أكثر أناقة لخلق الفوضى.8889## القطعة الرابعة: الهوية والأذونات9091هذا هو المجال الذي تغض فيه العديد من العروض التوضيحية أعينها.9293وكيل يعمل نيابة عن شخص ما. لذلك يجب أن يكون واضحا من هو موضوع الإجراء.9495هل يستخدم أذونات المستخدم؟ من حساب الخدمة؟ من مساحة العمل؟ هل لديك وصول مؤقت أو دائم؟ هل يمكنك قراءة كل شيء أم بعض الموارد فقط؟ هل يمكنك الكتابة؟ هل يمكنك الإلغاء؟ هل يمكنه إرسال رسائل نصية إلى أشخاص حقيقيين؟9697إذا لم تجب على هذه الأسئلة بشكل جيد، فسوف تقوم عاجلاً أم آجلاً ببناء مساعد بمفاتيح المنزل ولن يتذكر من أعطاها له.9899القاعدة الأساسية التي أحبها هي: يجب أن يكون الوكيل قادرًا على القيام بعمل أقل من الإنسان، وليس أكثر من الإنسان. وعندما يتعين عليه القيام بشيء أكثر خطورة، عليه أن يتوقف ويسأل.100101وهذا يعني OAuth، والرمز المميز، والإدارة السرية، وسجل التدقيق، وسياسة الأداة، والقائمة المسموح بها، وخطوة الموافقة. ليست أشياء رومانسية للغاية. الاشياء الضرورية.102103## القطعة الخامسة: الذاكرة والسياق ولكن دون مراكمة القمامة104105يحتاج العملاء إلى الذاكرة، لكن الذاكرة تكون خطيرة عندما تصبح علية.106107هناك على الأقل ثلاثة أنواع من الذاكرة:108109- تشغيل الذاكرة: ما حدث في هذا التنفيذ؛110- ذاكرة المشروع: الاتفاقيات والقرارات والقيود؛111- الذاكرة الشخصية أو الجماعية: التفضيلات والنبرة والطقوس والعمليات.112113وضع كل شيء في الموجه هو الاختصار. إنه يعمل حتى لا يعمل بعد الآن. يجب الاهتمام بالذاكرة المفيدة: فهرستها، وتحديثها، وانتهت صلاحيتها، والتحقق منها، وجعلها قابلة للاستشهاد بها.114115الوكيل الذي يتذكر بشكل سيء هو أسوأ من العميل الذي لا يتذكر. لأنه يتحدث بثقة.116117لذلك يجب أن تتضمن البنية التحتية عمليات الاسترجاع وملفات التعليمات وقاعدة المعرفة والتضمين عند الحاجة، وكذلك التنظيف. نحن بحاجة إلى ثقافة الذاكرة: ما الذي يدخلها، ومن يوافق عليها، ومتى تضمحل، وكيف أصححها.118119## القطعة السادسة: الملاحظة والتقييم والإعادة120121إذا ارتكب الوكيل خطأً، فإن سجل "النموذج المُسمى" لن يكون كافيًا.122123تريد أن ترى الطريق. ما السياق الذي تلقاه؟ ما هي الأدوات التي كانت متاحة؟ ما هي الأداة التي اخترتها؟ بأية حجج؟ ما الرد الذي حصلت عليه؟ كم تكلف؟ أين علقت؟ هل وافق الإنسان على شيء؟ هل نموذج الخطأ أو الأداة أو المطالبة أو البيانات أو الخطأ في الإذن؟124125هنا يشبه الوكلاء الأنظمة الموزعة أكثر من روبوتات الدردشة.126127أنت بحاجة إلى آثار قابلة للقراءة، وليس فقط سجلات نصية. يجب أن تكون قادرًا على إعادة تشغيل الجولة. من الضروري مقارنة نسختين من نفس الوكيل في المهام المعروفة. نحن بحاجة إلى قياس التراجعات: فهي لا "تستجيب بشكل أفضل" فحسب، بل إنها "تغلق التذكرة الصحيحة دون لمس الملفات غير المرغوب فيها".128129تعد عمليات تقييم الوكيل أكثر صعوبة من عمليات تقييم النص لأنها تتضمن إجراءات. لا يكفي مقارنة سلسلة متوقعة. عليك أن تنظر إلى التسلسل والآثار الجانبية وجودة المنتج والوقت والتكلفة وعدد التدخلات البشرية.130131الشيء المضحك هو أننا نعود دائمًا إلى هناك: هندسة البرمجيات. الاختبارات والبيئات والتتبعات والتراجعات. باستثناء أن الكود الآن يقرر أيضًا ما يجب فعله بعد ذلك.132133## القطعة السابعة: الواجهات البشرية134135لا يتعين على الوكيل أن يعيش في الدردشة فقط.136137بعض الوكلاء يحتاجون إلى لوحة. الآخرين صفحة مع الحالة والسجل. أخرى من زر "الموافقة". المزيد من التعليقات المضمنة. لا يزال البعض الآخر من CLI.138139واجهة المستخدم تغير السلوك. إذا كانت الطريقة الوحيدة للتحكم في الوكيل هي كتابة رسالة طويلة، فسيقوم المستخدم بإعطاء الوكيل تعليمات غامضة. ومع ذلك، إذا رأى الخطة والاختلافات والمصادر والمخاطر والإجراء التالي، فيمكنه التدخل بدقة.140141تشتمل البنية التحتية اللائقة للوكيل على أسطح التحكم:142143- الوضع الحالي.144- خطة قابلة للتحرير.145- المصنوعات اليدوية المنتجة؛146- فرق؛147- طلبات الموافقة؛148- التسلسل الزمني.149- زر التوقف؛150- زر إعادة المحاولة؛151- أذونات مرئية.152153يبدو الأمر تافها، لكنه ليس كذلك. غالبًا ما يكون الفرق بين "الذكاء الاصطناعي المخيف" و"المساعد الموثوق" هو أن الأخير يوضح لك مكان وجوده.154155## المكدس العقلي156157إذا كنت سأرسمه اليوم، فسيكون الحد الأدنى لمجموعة الوكيل هو:1581591. النموذج: الاستدلال، والتوليد، واستدعاء الأدوات، والوسائط المتعددة إذا لزم الأمر.1602. التنسيق: الحلقة، الخطوة، المخطط، السياسة، الإنسان في الحلقة.1613. وقت تشغيل متين: سير العمل، وقائمة الانتظار، وإعادة المحاولة، والإيقاف المؤقت، والاستئناف.1624. Sandbox: تنفيذ التعليمات البرمجية، ونظام الملفات المعزول، والقيود، والتحف.1635. طبقة الأدوات: MCP، واجهة برمجة التطبيقات الداخلية، المتصفح، قاعدة البيانات، المستودع.1646. طبقة الهوية: OAuth، النطاق، السر، التدقيق، السياسة.1657. طبقة الذاكرة: سياق المشروع، الاسترجاع، التعليمات، انتهاء الصلاحية.1668. إمكانية الملاحظة: مقاييس التتبع وإعادة التشغيل والتقييم والتكلفة والجودة.1679. سطح المنتج: قم بالدردشة عند الحاجة، ولوحة القيادة عند الحاجة، والمراجعة عندما يكون الأمر مهمًا.168169يغطي الإطار الوكيل بشكل أساسي النقاط 2 وجزءًا من النقطة 1. والباقي هو العمل الحقيقي.170171## ما سأفعله عمليًا172173إذا قال لي الفريق "نريد وكلاء في الإنتاج"، فلن أبدأ بعشرة وكلاء.174175سأبدأ بسير عمل صغير ومتكرر ويمكن ملاحظته. على سبيل المثال: فتح تقارير العلاقات العامة الخاصة بالصيانة، وتحديث الوثائق من الإصدارات المغلقة، وإعداد مراجعة أسبوعية، وفرز الأخطاء المكررة، وإنشاء اختبارات للملفات المتأثرة.176177ثم سأضع حدودًا واضحة جدًا:178179- لا كتابة بدون فروع أو رمل؛180- لا أسرار في الموجه؛181- الأدوات في القائمة المسموح بها؛182- موافقة الإنسان على الإجراءات الخارجية؛183- سجل وتتبع إلزامي؛184- الميزانية لكل تشغيل؛185- الإخراج قابل للفحص دائمًا.186187عندها فقط سأتوسع.188189الوكلاء لا يفشلون لمجرد أن النماذج أخطأت في فهمهم. إنهم يفشلون لأننا نضعهم في بيئات غامضة، بأذونات مربكة وتوقعات مسرحية.190191##قراءتي192193البنية التحتية للوكالة مملة بأفضل طريقة.194195إنه ليس الجزء الذي يجعلك تصفق في العرض التوضيحي. إنه الجزء الذي يتيح لك استخدام العرض التوضيحي صباح يوم الاثنين، مع أشخاص حقيقيين، وبيانات حقيقية، وعواقب حقيقية.196197لن يتم تحديد مستقبل الوكلاء فقط من خلال من لديه أفضل قدوة. سيقرره من يبني أفضل مكان ليعمل فيه: منعزل عندما يقوم بالتجارب، متصل عند الحاجة، يمكن ملاحظته دائمًا، مخول بمعايير ومتواضع بما يكفي للتوقف عندما لا يعرف.198199هذا هو المكان الذي يتوقف فيه العملاء عن كونهم لعبة ويصبحون بنية تحتية.200201## مصادر202203- [Vercel: كيفية إنشاء عملاء الذكاء الاصطناعي باستخدام Vercel وAI SDK](https://vercel.com/kb/guide/how-to-build-ai-agents-with-vercel-and-the-ai-sdk)204- [مستندات Vercel: Sandbox](https://vercel.com/docs/sandbox)205- [مستندات Vercel: العمل مع Sandbox](https://vercel.com/docs/sandbox/working-with-sandbox)206- [مستندات فيرسيل: MCP](https://vercel.com/docs/mcp)207- [بروتوكول سياق النموذج: المواصفات](https://modelcontextprotocol.io/specation)208- [OpenAI: أدوات جديدة لوكلاء البناء](https://openai.com/index/new-tools-for-building-agents/)209- [مدونة Cloudflare: الوكلاء على Cloudflare](https://blog.cloudflare.com/agents-on-cloudflare/)210
:البنية التحتية الوكيلة والواجهة الخلفية الجديدةlines 1-210 (END) — press q to close