spinny:~/writing $ vim agentic-infrastructure-stack.md
1~2ہم نے اکثر ایجنٹی فریم ورک کے بارے میں بات کی ہے۔ LangGraph، CrewAI، AutoGen، مختلف SDKs، لوپ، ٹول کالنگ، میموری، منصوبہ ساز، نقاد، سپروائزر۔ تمام مفید الفاظ، نیکی کی خاطر۔ لیکن جتنا میں اصل میں استعمال ہونے والے ایجنٹوں کو دیکھتا ہوں، اتنا ہی مجھے لگتا ہے کہ دلچسپ حصہ فریم ورک کی سطح سے نیچے چلا گیا ہے۔3~4سوال اب صرف یہ نہیں ہے کہ میں ایک سٹیپ ماڈل سوچنے کے لیے کون سی لائبریری استعمال کروں؟5~6اصل سوال یہ ہے کہ: جب یہ ایجنٹ ڈیمو بننا چھوڑ دیتا ہے تو وہ کہاں رہتا ہے؟7~8کیونکہ ایک سنجیدہ ایجنٹ کوئی فنکشن نہیں ہے جو ماڈل کو کال کرتا ہے اور متن واپس کرتا ہے۔ یہ ایک چھوٹا تقسیم شدہ نظام ہے۔ اسے سیاق و سباق کو پڑھنا، ٹولز استعمال کرنا، کوڈ پر عمل کرنا، فائلوں کو ٹچ کرنا، فیصلے یاد رکھنا، اجازت طلب کرنا، اچھی طرح سے ناکام ہونا، دوبارہ شروع کرنا، لاگ چھوڑنا، بجٹ کو جلانا نہیں اور پروڈکشن ریپوزٹری کے اندر بلڈوزر میں تبدیل نہیں ہونا چاہیے۔9~10فریم ورک اسٹیئرنگ وہیل ہے۔ بنیادی ڈھانچہ سڑک، بریک، گیراج، انشورنس اور وہ شخص ہے جو جانتا ہے کہ چابیاں کہاں ہیں۔11~12## کیونکہ اب اس کے بارے میں بہت چرچا ہے۔13~142023 اور 2024 میں بات چیت بہت ماڈل پر مبنی تھی۔ کون سی ایل ایل ایم؟ کتنا سیاق و سباق؟ اس کی قیمت کتنی ہے؟ وہ پروگرامنگ میں کتنا اچھا ہے؟15~162025 اور 2026 میں بات چیت میں تبدیلی آئی ہے۔ ماڈلز حقیقی کام کرنے کے لیے کافی اچھے ہیں، لیکن اسی لیے بورنگ بٹس نظر آنے لگتے ہیں: رن ٹائم، سیکیورٹی، کنیکٹر، شناخت، مشاہدہ، کوڈ پر عمل درآمد، تعیناتی، رول بیک۔17~18یہ جادو سے انجینئرنگ میں قدرتی منتقلی ہے۔19~20جب کسی ایجنٹ کو صرف جواب پیدا کرنے کی ضرورت ہوتی ہے، تو بات چیت کافی ہوتی ہے۔ جب آپ کو پل کی درخواست کھولنے، ڈیٹا بیس سے استفسار کرنے، CRM کو کال کرنے، کوئی کام شروع کرنے، کسی سائٹ پر نیویگیٹ کرنے، Slack کو پڑھنے، کوڈ کو مرتب کرنے اور کسی دستاویز کو اپ ڈیٹ کرنے کی ضرورت ہو تو آپ کو اس کے ارد گرد آپریٹنگ سسٹم کی ضرورت ہوتی ہے۔21~22لفظی معنی میں نہیں۔ تنظیمی لحاظ سے۔23~24## پہلا ٹکڑا: ایک رن ٹائم جہاں ایجنٹ چل سکتا ہے۔25~26ایک ایجنٹ اکثر قدموں میں کام کرتا ہے۔ ریاست کو دیکھیں، ایک عمل کا انتخاب کریں، ایک ٹول استعمال کریں، نتیجہ دیکھیں، پلان کو اپ ڈیٹ کریں، دہرائیں۔27~28اگر یہ لوپ ایک ہی HTTP درخواست کے اندر رہتا ہے، تو آپ کو فوری طور پر ایک مسئلہ درپیش ہے۔ کچھ اعمال سست ہیں۔ کچھ انسانی ان پٹ کے منتظر ہیں۔ کچھ ناکام ہو جاتے ہیں اور دوبارہ کوشش کی جانی چاہیے۔ کچھ کو تعیناتی یا ٹائم آؤٹ سے بچنا چاہیے۔29~30یہ وہ جگہ ہے جہاں پائیدار ورک فلو، قطاریں، ملازمت کے پس منظر اور ریاستی مشینیں کام میں آتی ہیں۔ وہ گلیمرس نہیں ہیں، لیکن یہ ایک ایسے ایجنٹ کے درمیان فرق ہے جو ڈیمو پر ہوشیار لگتا ہے اور ایک جسے آپ کافی لینے جاتے وقت کام چھوڑ سکتے ہیں۔31~32میرے لئے ایجنٹ رن ٹائم کو بہت ٹھوس سوالات کے جوابات دینے چاہئیں:33~34- میں ریاست کو ایک قدم اور دوسرے کے درمیان کہاں بچاؤں؟35- اگر عمل آدھے راستے میں ختم ہو جائے تو کیا ہوگا؟36- کیا میں روک سکتا ہوں اور منظوری مانگ سکتا ہوں؟37- کیا میں یہ سمجھنے کے لیے رن چلا سکتا ہوں کہ اس نے یہ انتخاب کیوں کیا؟38- کیا میں مدت، میموری، ٹولز اور لاگت کو محدود کر سکتا ہوں؟39~40Vercel اس محاذ پر AI SDKs، فنکشنز، ورک فلوز اور ویب ایپلیکیشنز کے اندر ایجنٹس بنانے کے لیے ٹولز کے ساتھ زور دے رہا ہے۔ لیکن بات صرف ورسل کی نہیں ہے۔ بات یہ ہے کہ ایجنٹ کو ایک آپریشنل گھر کی ضرورت ہے، نہ کہ ایک آخری نقطہ۔41~42## دوسرا ٹکڑا: سینڈ باکس، کیونکہ ایجنٹ کو توڑے بغیر گندا ہونے کے قابل ہونا چاہیے۔43~44جیسے ہی کوئی ایجنٹ کوڈ لکھتا ہے یا حکم دیتا ہے، ایک سینڈ باکس کی ضرورت ہوتی ہے۔45~46یہ ایک تکنیکی لفظ کی طرح لگتا ہے، لیکن خیال گھریلو ہے: آپ اسے ایک ورک بینچ دیتے ہیں۔ یہ فائلیں کھول سکتا ہے، انحصار انسٹال کر سکتا ہے، ٹیسٹ چلا سکتا ہے، تجربات کر سکتا ہے، آؤٹ پٹ تیار کر سکتا ہے۔ اگر وہ اسے غلط سمجھتا ہے، تو آپ نے نقصان کو سمیٹ لیا ہے۔ اگر یہ کام کرتا ہے تو نتیجہ کو فروغ دیں۔47~48ایک ایجنٹ سینڈ باکس میں کچھ خصوصیات ہونی چاہئیں:49~50- الگ تھلگ فائل سسٹم؛51- سی پی یو، میموری اور وقت کی حد؛52- کنٹرول نیٹ ورک؛53- راز صرف اس وقت نصب کیے جاتے ہیں جب ضرورت ہو۔54- مکمل نوشتہ جات؛55- نمونے برآمد کرنے کا امکان؛56- رنز کے درمیان کلین ری سیٹ، جب ضروری ہو۔57~58ورسل سینڈ باکس بالکل اسی سمت جاتا ہے: کوڈ چلانے، انحصار کو انسٹال کرنے، فائلوں کے ساتھ کام کرنے اور مین ایپلیکیشن رن ٹائم میں سب کچھ چلائے بغیر نمونے تیار کرنے کے لیے الگ تھلگ ماحول۔59~60یہ بات اس سے کہیں زیادہ اہم ہے جتنا کہ لگتا ہے۔ بہت سے ایجنٹ پروٹوٹائپس ماڈل سے حقیقی نظام میں براہ راست چھلانگ لگاتے ہیں. ماڈل ٹول کو کال کرسکتا ہے۔ ٹولز چیزیں کر سکتے ہیں۔ یہ سب پہلی غلط کمانڈ تک خوبصورت لگتا ہے، غلط جگہ پر پہلا انحصار انسٹال ہوتا ہے، پہلا ٹوکن جو لاگ میں ختم ہوتا ہے۔61~62سینڈ باکس یہ کہنے کا بالغ طریقہ ہے: آگے بڑھو، لیکن یہاں۔63~64## تیسرا حصہ: MCP اور کنیکٹر کا مسئلہ65~66ماڈل سیاق و سباق پروٹوکول ماحولیاتی نظام کے سب سے دلچسپ حصوں میں سے ایک بن گیا ہے کیونکہ یہ کسی ایسی چیز کو معیاری بنانے کی کوشش کرتا ہے جو بصورت دیگر فوری طور پر ناقابل انتظام ہو جاتا ہے: ایک ماڈل کس طرح بیرونی آلات کو دریافت کرتا ہے اور استعمال کرتا ہے۔67~68معیار کے بغیر، ہر انضمام ایک چھوٹا جزیرہ ہے۔ GitHub کے کنیکٹر نے ایک طرح سے کیا، ایک Slack کے لیے دوسرا، ایک مختلف سیمنٹکس والے ڈیٹا بیس کے لیے، ایک براؤزر آٹومیشن کے لیے جو کچھ بھی نہیں لگتا ہے۔69~70MCP کلائنٹ اور سرور کے درمیان ایک مشترکہ زبان تجویز کرتا ہے: ٹولز، وسائل، اشارے، اجازت، نقل و حمل، دریافت۔ یہ جادوئی طور پر حکمرانی اور سلامتی کو حل نہیں کرتا، لیکن یہ ایک گرامر دیتا ہے۔71~72اور گرامر کے معاملات۔ جب ایک ایجنٹ بہت سے ٹولز سے جڑ سکتا ہے، تو سوال صرف یہ نہیں ہوتا کہ "کیا وہ یہ کر سکتا ہے؟"۔ مسئلہ یہ ہے کہ "کیا وہ سمجھتا ہے کہ وہ کیا کر سکتا ہے، کن حدود کے ساتھ، کس کی طرف سے، اور کیا نشان چھوڑ رہا ہے؟"۔73~74میرے لئے MCP hype نہیں ہے کیونکہ یہ "ٹول کالنگ کرتا ہے"۔ ہم نے پہلے ہی ایسا کیا ہے۔ یہ ہائپ ہے کیونکہ یہ کشش ثقل کے مرکز کو واحد انضمام سے ٹولز کے آپریشنل کیٹلاگ میں منتقل کرتا ہے۔75~76ایک اچھے ایجنٹی فن تعمیر میں، MCP ایک قسم کا پیچ پینل بن جاتا ہے:77~78- کوڈ اور مسائل کے لیے گٹ ہب؛79- بات چیت کے سیاق و سباق کے لئے سست؛80- منصوبہ بند کام کے لیے لکیری یا جیرا؛81- تجزیات کے لیے صرف پڑھنے کے لیے ڈیٹا بیس؛82- بیرونی سائٹس کے لیے براؤزر یا کھرچنے والا کنٹرول؛83- دستاویز کا ذخیرہ؛84- الگ تھلگ پھانسی کے ماحول؛85- اندرونی نظام سخت اجازتوں کے ساتھ بے نقاب۔86~87مشکل حصہ یہ ہے کہ پالیسی فری ٹول کیٹلاگ افراتفری پیدا کرنے کا ایک زیادہ خوبصورت طریقہ ہے۔88~89## چوتھا حصہ: شناخت اور اجازت90~91یہ وہ علاقہ ہے جہاں بہت سے ڈیمو آنکھیں بند کر لیتے ہیں۔92~93ایک ایجنٹ کسی کی طرف سے کام کرتا ہے۔ تو یہ واضح ہونا چاہیے کہ عمل کا موضوع کون ہے۔94~95کیا یہ صارف کی اجازت استعمال کر رہا ہے؟ سروس اکاؤنٹ کا؟ کام کی جگہ کا؟ کیا آپ کے پاس عارضی یا مستقل رسائی ہے؟ کیا آپ سب کچھ پڑھ سکتے ہیں یا صرف کچھ وسائل؟ کیا آپ لکھ سکتے ہیں؟ کیا آپ منسوخ کر سکتے ہیں؟ Can he text real people?96~97اگر آپ ان سوالات کے اچھے جواب نہیں دیتے ہیں، تو جلد یا بدیر آپ گھر کی چابیاں کے ساتھ ایک اسسٹنٹ بنائیں گے اور اس بات کی کوئی یاد نہیں رہے گی کہ انہیں کس نے دیا ہے۔98~99انگوٹھے کا اصول مجھے یہ پسند ہے: ایجنٹ کو انسان سے کم کرنے کے قابل ہونا چاہئے، انسان سے زیادہ نہیں۔ اور جب اسے کوئی خطرناک کام کرنا ہو تو اسے روک کر پوچھنا پڑتا ہے۔100~101اس کا مطلب ہے OAuth، ٹوکن اسکوپڈ، خفیہ انتظام، آڈٹ لاگ، ٹول پالیسی، اجازت کی فہرست، منظوری کا مرحلہ۔ بہت رومانٹک چیزیں نہیں۔ ضروری سامان۔102~103## پانچواں ٹکڑا: یادداشت اور سیاق و سباق، لیکن کوڑا کرکٹ جمع کیے بغیر104~105ایجنٹوں کو میموری کی ضرورت ہوتی ہے، لیکن یادداشت خطرناک ہوتی ہے جب یہ اٹاری بن جاتی ہے۔106~107یادداشت کی کم از کم تین اقسام ہیں:108~109- میموری چلائیں: اس عمل میں کیا ہوا؛110- پروجیکٹ میموری: کنونشنز، فیصلے، رکاوٹیں؛111- ذاتی یا ٹیم میموری: ترجیحات، لہجہ، رسومات، عمل۔112~113ہر چیز کو پرامپٹ میں ڈالنا ہی شارٹ کٹ ہے۔ یہ اس وقت تک کام کرتا ہے جب تک کہ یہ کام نہ کرے۔ مفید میموری کا خیال رکھنا ضروری ہے: انڈیکسڈ، اپ ڈیٹ، میعاد ختم، تصدیق شدہ، قابل ذکر۔114~115ایک ایجنٹ جو بُری طرح یاد رکھتا ہے وہ اس ایجنٹ سے بدتر ہے جو یاد نہیں رکھتا۔ کیونکہ وہ اعتماد کے ساتھ بولتا ہے۔116~117اس لیے بنیادی ڈھانچے میں بازیافت، ہدایات کی فائلیں، علم کی بنیاد، ضرورت پڑنے پر سرایت کرنا، بلکہ صفائی بھی شامل ہونا چاہیے۔ ہمیں میموری کی ثقافت کی ضرورت ہے: کیا داخل ہوتا ہے، کون اسے منظور کرتا ہے، جب یہ زوال پذیر ہوتا ہے، میں اسے کیسے درست کروں۔118~119## چھٹا ٹکڑا: مشاہدہ، ایول اور ری پلے120~121اگر کوئی ایجنٹ غلطی کرتا ہے، تو "ماڈل کہلاتا ہے" لاگ کافی نہیں ہے۔122~123آپ راستہ دیکھنا چاہتے ہیں۔ اس نے کیا سیاق و سباق حاصل کیا؟ کون سے اوزار دستیاب تھے؟ آپ نے کون سا ٹول منتخب کیا؟ کن دلائل سے؟ آپ کو کیا جواب ملا؟ اس پر کتنا خرچ آیا؟ کہاں پھنس گیا؟ کیا انسان کو کچھ منظور تھا؟ کیا ایرر ماڈل، ٹول، پرامپٹ، ڈیٹا یا اجازت کی غلطی ہے؟124~125یہاں ایجنٹ چیٹ بوٹس سے زیادہ تقسیم شدہ نظام کی طرح ہیں۔126~127آپ کو پڑھنے کے قابل نشانات کی ضرورت ہے، نہ کہ صرف ٹیکسٹ لاگز۔ آپ کو ایک رن دوبارہ چلانے کے قابل ہونے کی ضرورت ہے۔ معلوم کاموں پر ایک ہی ایجنٹ کے دو ورژن کا موازنہ کرنا ضروری ہے۔ ہمیں رجعت کی پیمائش کرنے کی ضرورت ہے: یہ نہ صرف "بہتر جواب" دیتا ہے، بلکہ یہ "غیر منقولہ فائلوں کو چھوئے بغیر صحیح ٹکٹ بند کر دیتا ہے"۔128~129ایجنٹی ایولز ٹیکسٹ ایولز سے زیادہ مشکل ہیں کیونکہ ان میں اعمال شامل ہیں۔ متوقع سٹرنگ کا موازنہ کرنا کافی نہیں ہے۔ آپ کو ترتیب، ضمنی اثرات، نوادرات کا معیار، وقت، قیمت، انسانی مداخلتوں کی تعداد کو دیکھنا ہوگا۔130~131مزے کی بات یہ ہے کہ ہم ہمیشہ وہاں واپس آتے ہیں: سافٹ ویئر انجینئرنگ۔ ٹیسٹ، ماحول، نشانات، رول بیکس۔ سوائے اس کے کہ کوڈ اب یہ بھی فیصلہ کرتا ہے کہ آگے کیا کرنا ہے۔132~133## ساتواں ٹکڑا: انسانی انٹرفیس134~135ایجنٹ کو صرف چیٹ میں رہنے کی ضرورت نہیں ہے۔136~137کچھ ایجنٹوں کو بورڈ کی ضرورت ہوتی ہے۔ دوسروں کا اسٹیٹس اور لاگ کے ساتھ ایک صفحہ۔ "منظوری" بٹن کے دوسرے۔ مزید ان لائن تبصرے۔ اب بھی ایک CLI کے دیگر.138~139UI رویے کو تبدیل کرتا ہے۔ اگر ایجنٹ کو کنٹرول کرنے کا واحد طریقہ ایک لمبا پیغام لکھنا ہے، تو صارف ایجنٹ کو مبہم ہدایات دے گا۔ تاہم، اگر وہ منصوبہ، اختلاف، ذرائع، خطرات اور اگلی کارروائی دیکھتا ہے، تو وہ قطعی طور پر مداخلت کر سکتا ہے۔140~141ایک مہذب ایجنٹ کے بنیادی ڈھانچے میں کنٹرول سطحیں شامل ہیں:142~143- موجودہ حیثیت؛144- قابل تدوین منصوبہ؛145- تیار کردہ نوادرات؛146- فرق؛147- منظوری کی درخواستیں؛148- تاریخ149- سٹاپ بٹن؛150- دوبارہ کوشش کریں بٹن؛151- مرئی اجازتیں۔152~153یہ معمولی لگتا ہے، لیکن ایسا نہیں ہے۔ "کریپی اے آئی" اور "قابل اعتماد اسسٹنٹ" کے درمیان فرق اکثر اتنا ہوتا ہے کہ مؤخر الذکر آپ کو دکھاتا ہے کہ اس کے ہاتھ کہاں ہیں۔154~155## ذہنی اسٹیک156~157اگر میں آج اسے کھینچوں تو کم از کم ایجنٹ اسٹیک یہ ہوگا:158~1591. ماڈل: اگر ضروری ہو تو استدلال، نسل، ٹول کالنگ، ملٹی موڈل۔1602. آرکیسٹریشن: لوپ، قدم، منصوبہ ساز، پالیسی، انسانی اندر کا لوپ۔1613. پائیدار رن ٹائم: ورک فلو، قطار، دوبارہ کوشش، توقف، دوبارہ شروع کریں۔1624. سینڈ باکس: کوڈ پر عمل درآمد، الگ تھلگ فائل سسٹم، حدود، نمونے1635. ٹول پرت: MCP، اندرونی API، براؤزر، ڈیٹا بیس، ذخیرہ۔1646. شناختی پرت: OAuth، دائرہ کار، خفیہ، آڈٹ، پالیسی۔1657. میموری پرت: پراجیکٹ سیاق و سباق، بازیافت، ہدایات، میعاد ختم ہونا۔1668. مشاہدہ: ٹریس، ری پلے، ایول، لاگت اور کوالٹی میٹرکس۔1679. پروڈکٹ کی سطح: جب کافی ہو تو چیٹ کریں، ضرورت پڑنے پر ڈیش بورڈ، جب اہم ہو تب جائزہ لیں۔168~169ایجنٹ کا فریم ورک بنیادی طور پر پوائنٹس 2 اور پوائنٹ 1 کے ایک ٹکڑے کا احاطہ کرتا ہے۔ باقی اصل کام ہے۔170~171## میں عملی طور پر کیا کروں گا۔172~173اگر کسی ٹیم نے مجھے بتایا کہ "ہمیں پروڈکشن میں ایجنٹ چاہیے،" میں دس ایجنٹوں سے شروعات نہیں کروں گا۔174~175میں ایک چھوٹے، بار بار اور قابل مشاہدہ ورک فلو کے ساتھ شروع کروں گا۔ مثال کے طور پر: اوپن مینٹیننس پی آرز، بند ایشوز سے دستاویزات کو اپ ڈیٹ کریں، ہفتہ وار جائزہ تیار کریں، ڈپلیکیٹ کیڑے کو ٹرائیج کریں، متاثرہ فائلوں کے لیے ٹیسٹ تیار کریں۔176~177پھر میں بہت واضح حدود مقرر کروں گا:178~179- شاخوں یا سینڈ باکس کے بغیر کوئی تحریر؛180- پرامپٹ میں کوئی راز نہیں؛181- اجازت کی فہرست میں اوزار؛182- بیرونی اعمال کے لیے انسانی منظوری؛183- لازمی لاگ اور ٹریس؛184- فی رن بجٹ؛185- آؤٹ پٹ ہمیشہ قابل معائنہ۔186~187تب ہی میں توسیع کروں گا۔188~189ایجنٹ صرف اس وجہ سے ناکام نہیں ہوتے کہ ماڈلز اسے غلط سمجھتے ہیں۔ وہ ناکام ہو جاتے ہیں کیونکہ ہم انہیں مبہم ماحول میں رکھتے ہیں، مبہم اجازتوں اور تھیٹر کی توقعات کے ساتھ۔190~191## میرا پڑھنا192~193ایجنٹ کا بنیادی ڈھانچہ بہترین طریقے سے بورنگ ہے۔194~195یہ وہ حصہ نہیں ہے جو آپ کو ڈیمو میں تالیاں بجانے پر مجبور کرتا ہے۔ یہ وہ حصہ ہے جو آپ کو حقیقی لوگوں، حقیقی اعداد و شمار اور حقیقی نتائج کے ساتھ پیر کی صبح ڈیمو کو درحقیقت استعمال کرنے دیتا ہے۔196~197ایجنٹوں کے مستقبل کا فیصلہ صرف اس بات سے نہیں ہوگا کہ بہترین رول ماڈل کون ہے۔ اس کا فیصلہ وہ کرے گا جو بہترین جگہ بناتا ہے جس میں اسے کام کرنا ہے: جب وہ تجربہ کرے تو الگ تھلگ، ضرورت پڑنے پر جڑا، ہمیشہ قابل مشاہدہ، معیار کے ساتھ مجاز اور جب اسے معلوم نہ ہو تو رکنے کے لیے کافی شائستہ۔198~199یہی وہ جگہ ہے جہاں ایجنٹ کھلونا بننا چھوڑ کر انفراسٹرکچر بن جاتے ہیں۔200~201## ذرائع202~203- [Vercel: Vercel اور AI SDK کے ساتھ AI ایجنٹس کیسے بنائیں](https://vercel.com/kb/guide/how-to-build-ai-agents-with-vercel-and-the-ai-sdk)204- [Vercel Docs: Sandbox](https://vercel.com/docs/sandbox)205- [Vercel Docs: Sandbox کے ساتھ کام کرنا](https://vercel.com/docs/sandbox/working-with-sandbox)206- [Vercel Docs: MCP](https://vercel.com/docs/mcp)207- [ماڈل سیاق و سباق پروٹوکول: تفصیلات](https://modelcontextprotocol.io/specification)208- [OpenAI: عمارت کے ایجنٹوں کے لیے نئے ٹولز](https://openai.com/index/new-tools-for-building-agents/)209- [Cloudflare بلاگ: Cloudflare پر ایجنٹ](https://blog.cloudflare.com/agents-on-cloudflare/)210~
NORMAL · agentic-infrastructure-stack.md [readonly]210 lines · :q to close