spinny:~/writing $ vim agentic-infrastructure-stack.md
1~2Často jsme mluvili o agentních rámcích. LangGraph, CrewAI, AutoGen, různé SDK, smyčka, volání nástrojů, paměť, plánovač, kritik, supervizor. Všechna užitečná slova, proboha. Čím víc se ale dívám na skutečně použité agenty, tím víc se mi zdá, že se zajímavá část posunula pod rámec rámce.3~4Otázka už nezní jen: kterou knihovnu mám použít, aby krokový model přemýšlel?5~6Skutečná otázka zní: kde tento agent žije, když přestane být demo?7~8Protože seriózní agent není funkce, která volá model a vrací text. Je to malý distribuovaný systém. Musí číst kontext, používat nástroje, spouštět kód, dotýkat se souborů, pamatovat si rozhodnutí, žádat o povolení, dobře selhat, restartovat, nechat protokoly, nespálit rozpočet a neproměnit se v buldozer uvnitř produkčního úložiště.9~10Rámem je volant. Infrastruktura je silnice, brzdy, garáž, pojištění a člověk, který ví, kde jsou klíče.11~12## Protože se o tom teď hodně mluví13~14V letech 2023 a 2024 byla konverzace velmi zaměřená na model. Která LLM? Kolik kontextu? kolik to stojí? Jak dobrý je v programování?15~16V letech 2025 a 2026 se konverzace posunula. Modely jsou dost dobré na to, aby dělaly skutečnou práci, ale právě proto se zviditelní nudné kousky: runtime, zabezpečení, konektory, identita, pozorovatelnost, provádění kódu, nasazení, vrácení zpět.17~18Je to přirozený přechod od magie k inženýrství.19~20Když agent potřebuje vygenerovat odpověď, stačí chat. Když potřebujete otevřít požadavek na stažení, dotazovat se na databázi, volat CRM, spustit úlohu, procházet web, číst Slack, kompilovat kód a aktualizovat dokument, potřebujete kolem toho operační systém.21~22Ne v doslovném smyslu. V organizačním smyslu.23~24## První díl: běhové prostředí, kde agent vydrží25~26Agent často pracuje v krocích. Podívejte se na stav, vyberte akci, použijte nástroj, sledujte výsledek, aktualizujte plán, opakujte.27~28Pokud tato smyčka žije uvnitř jediného požadavku HTTP, máte okamžitě problém. Některé akce jsou pomalé. Někteří čekají na lidský zásah. Některé selžou a musí se zkusit znovu. Některé musí přežít nasazení nebo časový limit.29~30Zde přicházejí do hry trvalé pracovní postupy, fronty, pozadí úloh a stavové automaty. Nejsou okouzlující, ale je v nich rozdíl mezi agentem, který vypadá chytře na demu, a agentem, kterého můžete nechat pracovat, když si půjdete dát kávu.31~32Pro mě musí agentní runtime odpovídat na velmi konkrétní otázky:33~34- kam uložím stav mezi jedním krokem a druhým?35- co se stane, když proces v polovině skončí?36- mohu se pozastavit a požádat o schválení?37- Mohu si přehrát běh, abych pochopil, proč se tak rozhodl?38- mohu omezit dobu trvání, paměť, nástroje a náklady?39~40Vercel na této frontě tvrdě tlačí s AI SDK, funkcemi, pracovními postupy a nástroji pro vytváření agentů v rámci webových aplikací. Ale nejde jen o Vercela. Jde o to, že agent potřebuje operační domov, nikoli jeden koncový bod.41~42## Druhý kousek: pískoviště, protože agent se musí umět ušpinit, aniž by se rozbil43~44Jakmile agent napíše kód nebo provede příkazy, je potřeba sandbox.45~46Vypadá to jako technické slovo, ale myšlenka je domácí: dáte mu pracovní stůl. Může otevírat soubory, instalovat závislosti, spouštět testy, dělat experimenty, generovat výstup. Pokud to udělá špatně, zadržel jsi poškození. Pokud to funguje, propagujte výsledek.47~48Agentní karanténa by měla mít některé vlastnosti:49~50- izolovaný souborový systém;51- CPU, paměť a časové limity;52- řízená síť;53- tajemství namontovaná pouze v případě potřeby;54- kompletní protokoly;55- možnost exportu artefaktů;56- v případě potřeby čistý reset mezi běhy.57~58Vercel Sandbox jde přesně tímto směrem: izolovaná prostředí pro spouštění kódu, instalaci závislostí, práci se soubory a vytváření artefaktů, aniž by vše běželo v hlavním běhovém prostředí aplikace.59~60Tato věc je důležitější, než se zdá. Mnoho agentních prototypů skáče přímo z modelu do reálného systému. Model může volat nástroj. Nástroje dokážou věci. Všechno to vypadá elegantně až do prvního špatného příkazu, první závislosti nainstalované na špatném místě, prvního tokenu, který skončí v protokolu.61~62Pískoviště je způsob, jak říci dospělým: jděte do toho, ale tady.63~64## Třetí část: MCP a problém s konektorem65~66Protokol kontextu modelu se stal jednou z nejzajímavějších částí ekosystému, protože se snaží standardizovat něco, co se jinak rychle stane neovladatelným: jak model objevuje a používá externí nástroje.67~68Bez standardu je každá integrace malým ostrovem. Konektor pro GitHub vytvořený jedním způsobem, jeden pro Slack vytvořený druhým, jeden pro databáze s jinou sémantikou, jeden pro automatizaci prohlížeče, která vypadá jako nic.69~70MCP navrhuje společný jazyk mezi klientem a serverem: nástroje, zdroje, výzvy, autorizace, přenos, zjišťování. Kouzelně to neřeší vládnutí a bezpečnost, ale dává gramatiku.71~72A na gramatice záleží. Když se agent může připojit k mnoha nástrojům, otázka nezní jen „dokáže to?“. Problém je, "chápe, co může dělat, s jakými limity, jménem koho a zanechávat jakou stopu?".73~74Pro mě MCP není humbuk, protože „vyvolává nástroje“. Už jsme to udělali. Je to humbuk, protože posouvá těžiště z jednoduché integrace do provozního katalogu nástrojů.75~76V dobré agentní architektuře se MCP stává jakýmsi patch panelem:77~78- GitHub pro kód a problémy;79- Slabý pro konverzační kontext;80- Lineární nebo Jira pro plánovanou práci;81- databáze pouze pro čtení pro analýzu;82- prohlížeč nebo škrabák ovládaný pro externí stránky;83- ukládání dokumentů;84- izolovaná prováděcí prostředí;85- interní systémy vystavené s přísnými oprávněními.86~87Záludná část je v tom, že katalog nástrojů bez zásad je jen elegantnějším způsobem, jak vytvořit chaos.88~89## Čtvrtá část: identita a oprávnění90~91To je oblast, kde mnoho ukázek zavírá oči.92~93Agent jedná jménem někoho. Musí tedy být jasné, kdo je předmětem žaloby.94~95Používá uživatelská oprávnění? Servisní účet? Z pracovního prostoru? Máte dočasný nebo trvalý přístup? Umíte číst všechno nebo jen některé zdroje? umíš psát? můžete zrušit? Může psát SMS skutečným lidem?96~97Pokud na tyto otázky neodpovíte dobře, dříve nebo později si postavíte pomocníka s klíči od domu a bez paměti, kdo mu je dal.98~99Základní pravidlo, které se mi líbí, je toto: agent musí umět méně než člověk, ne více než člověk. A když musí udělat něco riskantnějšího, musí se zastavit a zeptat se.100~101To znamená OAuth, rozsah tokenu, správa tajemství, protokol auditu, zásady nástroje, seznam povolených, krok schválení. Ne moc romantické věci. Nezbytné věci.102~103## Pátý díl: paměť a kontext, ale bez hromadění odpadků104~105Agenti potřebují paměť, ale paměť je nebezpečná, když se stane podkrovím.106~107Existují alespoň tři typy paměti:108~109- paměť běhu: co se stalo při tomto provádění;110- paměť projektu: konvence, rozhodnutí, omezení;111- osobní nebo týmová paměť: preference, tón, rituály, procesy.112~113Vložení všeho do výzvy je zkratka. Funguje to, dokud to už nejde. O užitečnou paměť je třeba pečovat: indexovat, aktualizovat, vypršela platnost, ověřovat, učinit citovatelnou.114~115Agent, který si špatně pamatuje, je horší než agent, který si to nepamatuje. Protože mluví sebevědomě.116~117Infrastruktura proto musí zahrnovat vyhledávání, instrukční soubory, znalostní bázi, vkládání v případě potřeby, ale také čištění. Potřebujeme kulturu paměti: co vstupuje, kdo to schvaluje, když se rozpadá, jak to napravím.118~119## Šestý díl: pozorovatelnost, hodnocení a opakování120~121Udělá-li agent chybu, protokol „volaný model“ nestačí.122~123Chcete vidět trasu. Jaký kontext dostal? Jaké nástroje byly k dispozici? Jaký nástroj jste si vybrali? S jakými argumenty? Jakou odpověď jste dostali? kolik to stálo? Kde se to zaseklo? Schvaloval člověk něco? Je chybový model, nástroj, výzva, data nebo oprávnění chybou?124~125Zde jsou agenti spíše distribuovanými systémy než chatboty.126~127Potřebujete čitelné stopy, nejen textové protokoly. Musíte být schopni přehrát běh. Je nutné porovnat dvě verze stejného agenta na známých úlohách. Potřebujeme měřit regrese: nejenže „lépe odpovídá“, ale „uzavře správný lístek, aniž by se dotkl nevyžádaných souborů“.128~129Agentní hodnoty jsou obtížnější než textové, protože zahrnují akce. Nestačí porovnat očekávaný řetězec. Musíte se podívat na sekvence, vedlejší efekty, kvalitu artefaktu, čas, cenu, počet lidských zásahů.130~131Legrační je, že se tam vždy vracíme: softwarové inženýrství. Testy, prostředí, trasování, vrácení zpět. Až na to, že kód nyní také rozhoduje o tom, co dál.132~133## Sedmý díl: lidská rozhraní134~135Agent nemusí bydlet jen na chatu.136~137Někteří agenti potřebují desku. Ostatní stránka se stavem a logem. Ostatní tlačítko "schválit". Více vložených komentářů. Ještě další z CLI.138~139Uživatelské rozhraní mění chování. Pokud je jediným způsobem, jak ovládat agenta, napsat dlouhou zprávu, uživatel dá agentovi nejasné pokyny. Pokud však vidí plán, rozdíl, zdroje, rizika a další akci, může přesně zasáhnout.140~141Slušná infrastruktura agentů zahrnuje ovládací plochy:142~143- aktuální stav;144- upravitelný plán;145- vyrobené artefakty;146- rozdíl;147- žádosti o schválení;148- chronologie;149- tlačítko stop;150- tlačítko opakování;151- viditelná oprávnění.152~153Zdá se to triviální, ale není. Rozdíl mezi „strašidelnou umělou inteligencí“ a „spolehlivým asistentem“ je často jen v tom, že druhý vám ukáže, kde má ruce.154~155## Mentální zásobník156~157Kdybych to měl nakreslit dnes, minimální zásobník agentů by byl tento:158~1591. Model: uvažování, generování, volání nástrojů, v případě potřeby multimodální.1602. Orchestrování: smyčka, krok, plánovač, politika, člověk ve smyčce.1613. Trvalý běh: pracovní postup, fronta, opakování, pozastavení, obnovení.1624. Sandbox: provádění kódu, izolovaný souborový systém, omezení, artefakty.1635. Nástrojová vrstva: MCP, interní API, prohlížeč, databáze, úložiště.1646. Vrstva identity: OAuth, rozsah, tajemství, audit, politika.1657. Paměťová vrstva: kontext projektu, vyhledávání, instrukce, expirace.1668. Pozorovatelnost: sledování, přehrání, vyhodnocení, metriky nákladů a kvality.1679. Povrch produktu: chatujte, když je to dost, řídicí panel, když je potřeba, kontrolujte, když je to důležité.168~169Agentní rámec pokrývá hlavně body 2 a část bodu 1. Zbytek je skutečná práce.170~171## Co bych dělal v praxi172~173Kdyby mi tým řekl „chceme agenty ve výrobě“, nezačínal bych s deseti agenty.174~175Začal bych malým, opakujícím se a pozorovatelným pracovním postupem. Například: otevírat PR údržby, aktualizovat dokumentaci z uzavřených problémů, připravovat týdenní revizi, třídit duplicitní chyby, generovat testy pro postižené soubory.176~177Pak bych stanovil velmi jasné limity:178~179- žádné psaní bez větví nebo pískoviště;180- žádná tajemství ve výzvě;181- nástroje v seznamu povolených;182- lidské schvalování vnějších akcí;183- povinný protokol a sledování;184- rozpočet na běh;185- výstup vždy kontrolovatelný.186~187Teprve pak bych expandoval.188~189Agenti neselžou jen proto, že se modelky pletou. Selhají, protože jsme je umístili do vágních prostředí s matoucími oprávněními a divadelními očekáváními.190~191## Moje čtení192~193Infrastruktura agentů je nudná tím nejlepším způsobem.194~195Není to část, která vás nutí tleskat v demu. Je to část, která vám umožní skutečně použít demo v pondělí ráno se skutečnými lidmi, skutečnými daty a skutečnými důsledky.196~197O budoucnosti agentů nerozhodne jen to, kdo má nejlepší vzor. O tom bude rozhodovat ten, kdo postaví to nejlepší místo, kde ho donutí pracovat: izolovaný, když experimentuje, připojený, když je potřeba, vždy pozorovatelný, autorizovaný podle kritérií a dostatečně pokorný, aby přestal, když neví.198~199Tam agenti přestávají být hračkou a stávají se infrastrukturou.200~201## Zdroje202~203– [Vercel: Jak vytvářet agenty AI pomocí Vercel a AI SDK](https://vercel.com/kb/guide/how-to-build-ai-agents-with-vercel-and-the-ai-sdk)204~205- [Vercel Docs: Sandbox](https://vercel.com/docs/sandbox)206- [Vercel Docs: Práce se sandboxem](https://vercel.com/docs/sandbox/working-with-sandbox)207- [Vercel Docs: MCP](https://vercel.com/docs/mcp)208- [Model Context Protocol: Specification](https://modelcontextprotocol.io/specification)209- [OpenAI: Nové nástroje pro stavební agenty](https://openai.com/index/new-tools-for-building-agents/)210 – [Cloudflare Blog: Agents on Cloudflare](https://blog.cloudflare.com/agents-on-cloudflare/)211~
NORMAL · agentic-infrastructure-stack.md [readonly]211 lines · :q to close