Агентская инфраструктура и новый бэкэнд

spinny:~/writing $ less agentic-infrastructure-stack.md

1 
2Мы часто говорили об агентных фреймворках. LangGraph, CrewAI, AutoGen, различные SDK, цикл, вызов инструментов, память, планировщик, критик, супервизор. Все полезные слова, ради бога. Но чем больше я смотрю на реально используемые агенты, тем больше мне кажется, что самое интересное переместилось ниже уровня фреймворка.
3 
4Вопрос уже не просто в том: какую библиотеку мне использовать, чтобы заставить думать пошаговую модель?
5 
6Реальный вопрос заключается в следующем: где будет жить этот агент, когда он перестанет быть демо?
7 
8Потому что серьезный агент — это не функция, которая вызывает модель и возвращает текст. Это небольшая распределенная система. Он должен читать контекст, использовать инструменты, выполнять код, трогать файлы, запоминать решения, спрашивать разрешение, хорошо проваливаться, перезагружаться, оставлять логи, не сжигать бюджет и не превращаться в бульдозер внутри производственного репозитория.
9 
10Каркас – это руль. Инфраструктура — это дорога, тормоза, гараж, страховка и человек, который знает, где ключи.
11 
12## Потому что сейчас об этом много говорят
13 
14В 2023 и 2024 годах разговор был очень сосредоточен на моделях. Какой LLM? Сколько контекста? Сколько это стоит? Насколько он хорош в программировании?
15 
16В 2025 и 2026 годах разговор сместился. Модели достаточно хороши, чтобы выполнять реальную работу, но именно поэтому становятся видны скучные детали: время выполнения, безопасность, соединители, идентичность, наблюдаемость, выполнение кода, развертывание, откат.
17 
18Это естественный переход от магии к инженерии.
19 
20Когда агенту просто нужно сгенерировать ответ, достаточно чата. Когда вам нужно открыть запрос на включение, запросить базу данных, вызвать CRM, начать работу, перемещаться по сайту, прочитать Slack, скомпилировать код и обновить документ, вам нужна операционная система.
21 
22Не в буквальном смысле. В организационном смысле.
23 
24## Первая часть: среда выполнения, в которой агент может работать долго
25 
26Агент часто работает поэтапно. Посмотрите на состояние, выберите действие, используйте инструмент, наблюдайте за результатом, обновите план, повторите.
27 
28Если этот цикл существует внутри одного HTTP-запроса, у вас сразу возникает проблема. Некоторые действия выполняются медленно. Некоторые ждут вмешательства человека. Некоторые терпят неудачу, и их нужно попробовать еще раз. Некоторые должны пережить развертывание или тайм-аут.
29 
30Именно здесь в игру вступают устойчивые рабочие процессы, очереди, фоны заданий и конечные автоматы. Они не гламурны, но они представляют собой разницу между агентом, который на демо-версии кажется умным, и тем, кого можно оставить работать, пока вы идете за кофе.
31 
32По моему мнению, среда выполнения агента должна отвечать на очень конкретные вопросы:
33 
34- где мне сохранить состояние между одним шагом и другим?
35- что произойдет, если процесс завершится на полпути?
36- могу ли я сделать паузу и попросить одобрения?
37- могу ли я переиграть пробежку, чтобы понять, почему он сделал такой выбор?
38- могу ли я ограничить продолжительность, память, инструменты и стоимость?
39 
40Vercel активно продвигается в этом направлении, предлагая AI SDK, функции, рабочие процессы и инструменты для создания агентов в веб-приложениях. Но дело не только в Верселе. Дело в том, что агенту нужен оперативный дом, а не отдельная конечная точка.
41 
42##Вторая часть: песочница, ведь агент должен иметь возможность испачкаться, не сломавшись
43 
44Как только агент пишет код или выполняет команды, необходима песочница.
45 
46Вроде техническое слово, но идея бытовая: ты даешь ему верстак. Он может открывать файлы, устанавливать зависимости, запускать тесты, проводить эксперименты, генерировать выходные данные. Если он ошибется, вы возместите ущерб. Если это работает, продвигайте результат.
47 
48Агентская песочница должна иметь некоторые свойства:
49 
50- изолированная файловая система;
51- Ограничения по процессору, памяти и времени;
52- управляемая сеть;
53- секреты монтируются только при необходимости;
54- полные журналы;
55- возможность экспорта артефактов;
56- чистый сброс между запусками, если это необходимо.
57 
58Vercel Sandbox идет именно в этом направлении: изолированные среды для запуска кода, установки зависимостей, работы с файлами и создания артефактов без запуска всего в основной среде выполнения приложения.
59 
60Эта вещь важнее, чем кажется. Многие агентные прототипы переходят непосредственно из модели в реальную систему. Модель может вызвать инструмент. Инструменты могут делать многое. Все это кажется элегантным до первой неправильной команды, первой зависимости, установленной не в том месте, и первого токена, попадающего в журнал.
61 
62Песочница — это взрослый способ сказать: давай, но здесь.
63 
64## Третья часть: MCP и проблема с разъемом
65 
66Протокол контекста модели стал одной из самых интересных частей экосистемы, поскольку он пытается стандартизировать то, что в противном случае быстро становится неуправляемым: то, как модель обнаруживает и использует внешние инструменты.
67 
68Без стандарта каждая интеграция представляет собой маленький остров. Коннектор для GitHub сделан так, один для Slack — другой, один для баз данных с разной семантикой, один для автоматизации браузера, который выглядит ни на что.
69 
70MCP предлагает общий язык между клиентом и сервером: инструменты, ресурсы, подсказки, авторизация, транспорт, обнаружение. Он не решает волшебным образом проблемы управления и безопасности, но дает грамматику.
71 
72И грамматика имеет значение. Когда агент может подключиться ко многим инструментам, вопрос не просто в том, «сможет ли он это сделать?». Проблема в том, «понимает ли он, что он может сделать, в каких пределах, от имени кого и какой след оставить?».
73 
74Для меня MCP — это не шумиха, потому что он «вызывает инструменты». Мы уже это сделали. Это хайп, потому что он смещает центр тяжести с единой интеграции на оперативный каталог инструментов.
75 
76В хорошей агентной архитектуре MCP становится своего рода патч-панелью:
77 
78- GitHub для кода и проблем;
79- Slack для разговорного контекста;
80- Linear или Jira для плановых работ;
81- доступная только для чтения база данных для аналитики;
82- браузер или парсер, контролируемый для внешних сайтов;
83- хранение документов;
84- изолированные среды выполнения;
85- внутренние системы подвергаются строгим разрешениям.
86 
87Сложность заключается в том, что каталог инструментов без политики — это всего лишь более элегантный способ создать хаос.
88 
89## Четвертая часть: личность и разрешения
90 
91Это та область, на которую многие демо-версии закрывают глаза.
92 
93Агент действует от чьего-либо имени. Поэтому должно быть ясно, кто является субъектом действия.
94 
95Используются ли права пользователя? Из сервисного аккаунта? Из рабочего места? У вас есть временный или постоянный доступ? Вы можете прочитать все или только некоторые ресурсы? Можешь написать? Можете ли вы отменить? Может ли он писать реальным людям?
96 
97Если вы плохо ответите на эти вопросы, рано или поздно у вас появится помощник с ключами от дома и без памяти о том, кто ему их дал.
98 
99Эмпирическое правило, которое мне нравится, заключается в следующем: агент должен быть способен делать меньше, чем человек, но не больше, чем человек. А когда ему нужно сделать что-то более рискованное, он должен остановиться и спросить.
100 
101Это означает OAuth, область действия токена, управление секретами, журнал аудита, политику инструментов, список разрешений, этап утверждения. Не очень романтическая вещь. Необходимые вещи.
102 
103##Пятый кусок: память и контекст, но без накопления мусора
104 
105Агентам нужна память, но память опасна, когда становится чердаком.
106 
107Существует как минимум три типа памяти:
108 
109- запустить память: что произошло в этом исполнении;
110- память проекта: условности, решения, ограничения;
111- личная или командная память: предпочтения, тон, ритуалы, процессы.
112 
113Поместить все в командную строку — это ярлык. Это работает до тех пор, пока не перестанет работать. О полезной памяти нужно заботиться: индексировать, обновлять, просрочивать, проверять, делать доступной для цитирования.
114 
115Агент, который плохо помнит, хуже агента, который не помнит. Потому что он говорит уверенно.
116 
117Поэтому инфраструктура должна включать поиск, файлы инструкций, базу знаний, встраивание при необходимости, а также очистку. Нужна культура памяти: что входит, кто это одобряет, когда приходит в упадок, как это исправить.
118 
119## Шестая часть: наблюдаемость, оценка и воспроизведение
120 
121Если агент допускает ошибку, журнала «вызванная модель» недостаточно.
122 
123Вы хотите увидеть маршрут. Какой контекст он получил? Какие инструменты были доступны? Какой инструмент вы выбрали? С какими аргументами? Какой ответ вы получили? Сколько это стоило? Где оно застряло? Одобрил ли человек что-нибудь? Является ли ошибка модели, инструмента, подсказки, данных или разрешения?
124 
125Здесь агенты больше похожи на распределенные системы, чем на чат-ботов.
126 
127Вам нужны читаемые трассировки, а не просто текстовые журналы. Вам нужно иметь возможность воспроизвести пробежку. Необходимо сравнить две версии одного и того же агента на известных задачах. Нам нужно измерить регрессию: он не только «отвечает лучше», но и «закрывает нужный тикет, не затрагивая нежелательные файлы».
128 
129Агентские оценки сложнее текстовых, поскольку они включают в себя действия. Недостаточно сравнить ожидаемую строку. Вы должны учитывать последовательность действий, побочные эффекты, качество артефакта, время, стоимость, количество человеческих вмешательств.
130 
131Самое смешное, что мы всегда возвращаемся к этому: разработке программного обеспечения. Тесты, окружения, трассировки, откаты. За исключением того, что код теперь тоже решает, что делать дальше.
132 
133## Часть седьмая: человеческие интерфейсы
134 
135Агенту не обязательно просто жить в чате.
136 
137Некоторым агентам нужна доска. Другие страница со статусом и журналом. Другие кнопки «одобрить». Больше встроенных комментариев. Still others of a CLI.
138 
139Пользовательский интерфейс меняет поведение. Если единственный способ контролировать агента — написать длинное сообщение, пользователь будет давать агенту расплывчатые инструкции. Однако если он видит план, различия, источники, риски и следующие действия, он может вмешаться.
140 
141Достойная агентская инфраструктура включает в себя поверхности управления:
142 
143- current status;
144- редактируемый план;
145- произведенные артефакты;
146- разница;
147- запросы на одобрение;
148- хронология;
149- кнопка остановки;
150- кнопка повтора;
151- видимые разрешения.
152 
153Это кажется тривиальным, но это не так. Разница между «жутким ИИ» и «надежным помощником» зачастую заключается лишь в том, что последний показывает вам, где у него руки.
154 
155## Ментальный стек
156 
157Если бы я нарисовал это сегодня, минимальный стек агентов был бы таким:
158 
1591. Модель: рассуждения, генерация, вызов инструментов, при необходимости мультимодальная.
1602. Оркестрация: цикл, шаг, планировщик, политика, участие человека в цикле.
1613. Надежная среда выполнения: рабочий процесс, очередь, повтор, пауза, возобновление.
1624. Песочница: выполнение кода, изолированная файловая система, ограничения, артефакты.
1635. Уровень инструментов: MCP, внутренний API, браузер, база данных, репозиторий.
1646. Уровень идентификации: OAuth, область действия, секрет, аудит, политика.
1657. Уровень памяти: контекст проекта, извлечение, инструкции, срок действия.
1668. Наблюдаемость: отслеживание, воспроизведение, оценка, метрики стоимости и качества.
1679. Поверхность продукта: чат, когда достаточно, информационная панель, когда это необходимо, просмотр, когда это важно.
168 
169Агентская структура в основном охватывает пункт 2 и часть пункта 1. Остальное — настоящая работа.
170 
171## Что бы я сделал на практике
172 
173Если бы команда сказала мне: «Нам нужны агенты в производстве», я бы не стал начинать с десяти агентов.
174 
175Я бы начал с небольшого, повторяющегося и наблюдаемого рабочего процесса. Например: открывать запросы на обслуживание, обновлять документацию по закрытым проблемам, готовить еженедельный обзор, сортировать повторяющиеся ошибки, создавать тесты для затронутых файлов.
176 
177Тогда я бы установил очень четкие ограничения:
178 
179- никакой записи без веток или песочницы;
180- никаких секретов в подсказке;
181- инструменты в белом списке;
182- человеческое одобрение внешних действий;
183- обязательная регистрация и трассировка;
184- бюджет на прогон;
185- выход всегда доступен для проверки.
186 
187Только тогда я бы расширился.
188 
189Агенты не терпят неудачу только потому, что модели ошибаются. Они терпят неудачу, потому что мы помещаем их в неопределенную среду, с запутанными разрешениями и театральными ожиданиями.
190 
191## Мое чтение
192 
193Агентская инфраструктура в лучшем смысле скучна.
194 
195Это не та часть, которая заставляет вас аплодировать в демо. Это та часть, которая позволяет вам использовать демо-версию в понедельник утром с реальными людьми, реальными данными и реальными последствиями.
196 
197Будущее агентов не будет решаться только тем, у кого лучший образец для подражания. Это будет решать тот, кто построит лучшее место, где он сможет работать: изолированный, когда он экспериментирует, подключенный, когда это необходимо, всегда наблюдаемый, уполномоченный критериями и достаточно скромный, чтобы остановиться, когда он не знает.
198 
199Именно здесь агенты перестают быть игрушкой и становятся инфраструктурой.
200 
201## Источники
202 
203- [Vercel: Как создавать агенты ИИ с помощью Vercel и AI SDK] (https://vercel.com/kb/guide/how-to-build-ai-agents-with-vercel-and-the-ai-sdk)
204- [Документы Vercel: Песочница](https://vercel.com/docs/sandbox)
205- [Документация Vercel: Работа с песочницей](https://vercel.com/docs/sandbox/working-with-sandbox)
206- [Документы Vercel: MCP](https://vercel.com/docs/mcp)
207- [Протокол контекста модели: спецификация](https://modelcontextprotocol.io/specification)
208- [OpenAI: Новые инструменты для создания агентов](https://openai.com/index/new-tools-for-building-agents/)
209- [Блог Cloudflare: Агенты в Cloudflare](https://blog.cloudflare.com/agents-on-cloudflare/)
210

:Агентская инфраструктура и новый бэкэндlines 1-210 (END) — press q to close

2Мы часто говорили об агентных фреймворках. LangGraph, CrewAI, AutoGen, различные SDK, цикл, вызов инструментов, память, планировщик, критик, супервизор. Все полезные слова, ради бога. Но чем больше я смотрю на реально используемые агенты, тем больше мне кажется, что самое интересное переместилось ниже уровня фреймворка.

4Вопрос уже не просто в том: какую библиотеку мне использовать, чтобы заставить думать пошаговую модель?

6Реальный вопрос заключается в следующем: где будет жить этот агент, когда он перестанет быть демо?

8Потому что серьезный агент — это не функция, которая вызывает модель и возвращает текст. Это небольшая распределенная система. Он должен читать контекст, использовать инструменты, выполнять код, трогать файлы, запоминать решения, спрашивать разрешение, хорошо проваливаться, перезагружаться, оставлять логи, не сжигать бюджет и не превращаться в бульдозер внутри производственного репозитория.

10Каркас – это руль. Инфраструктура — это дорога, тормоза, гараж, страховка и человек, который знает, где ключи.

12## Потому что сейчас об этом много говорят

14В 2023 и 2024 годах разговор был очень сосредоточен на моделях. Какой LLM? Сколько контекста? Сколько это стоит? Насколько он хорош в программировании?

16В 2025 и 2026 годах разговор сместился. Модели достаточно хороши, чтобы выполнять реальную работу, но именно поэтому становятся видны скучные детали: время выполнения, безопасность, соединители, идентичность, наблюдаемость, выполнение кода, развертывание, откат.

18Это естественный переход от магии к инженерии.

20Когда агенту просто нужно сгенерировать ответ, достаточно чата. Когда вам нужно открыть запрос на включение, запросить базу данных, вызвать CRM, начать работу, перемещаться по сайту, прочитать Slack, скомпилировать код и обновить документ, вам нужна операционная система.

22Не в буквальном смысле. В организационном смысле.

24## Первая часть: среда выполнения, в которой агент может работать долго

26Агент часто работает поэтапно. Посмотрите на состояние, выберите действие, используйте инструмент, наблюдайте за результатом, обновите план, повторите.

28Если этот цикл существует внутри одного HTTP-запроса, у вас сразу возникает проблема. Некоторые действия выполняются медленно. Некоторые ждут вмешательства человека. Некоторые терпят неудачу, и их нужно попробовать еще раз. Некоторые должны пережить развертывание или тайм-аут.

30Именно здесь в игру вступают устойчивые рабочие процессы, очереди, фоны заданий и конечные автоматы. Они не гламурны, но они представляют собой разницу между агентом, который на демо-версии кажется умным, и тем, кого можно оставить работать, пока вы идете за кофе.

32По моему мнению, среда выполнения агента должна отвечать на очень конкретные вопросы:

34- где мне сохранить состояние между одним шагом и другим?

35- что произойдет, если процесс завершится на полпути?

36- могу ли я сделать паузу и попросить одобрения?

37- могу ли я переиграть пробежку, чтобы понять, почему он сделал такой выбор?

38- могу ли я ограничить продолжительность, память, инструменты и стоимость?

40Vercel активно продвигается в этом направлении, предлагая AI SDK, функции, рабочие процессы и инструменты для создания агентов в веб-приложениях. Но дело не только в Верселе. Дело в том, что агенту нужен оперативный дом, а не отдельная конечная точка.

42##Вторая часть: песочница, ведь агент должен иметь возможность испачкаться, не сломавшись

44Как только агент пишет код или выполняет команды, необходима песочница.

46Вроде техническое слово, но идея бытовая: ты даешь ему верстак. Он может открывать файлы, устанавливать зависимости, запускать тесты, проводить эксперименты, генерировать выходные данные. Если он ошибется, вы возместите ущерб. Если это работает, продвигайте результат.

48Агентская песочница должна иметь некоторые свойства:

50- изолированная файловая система;

51- Ограничения по процессору, памяти и времени;

52- управляемая сеть;

53- секреты монтируются только при необходимости;

54- полные журналы;

55- возможность экспорта артефактов;

56- чистый сброс между запусками, если это необходимо.

58Vercel Sandbox идет именно в этом направлении: изолированные среды для запуска кода, установки зависимостей, работы с файлами и создания артефактов без запуска всего в основной среде выполнения приложения.

60Эта вещь важнее, чем кажется. Многие агентные прототипы переходят непосредственно из модели в реальную систему. Модель может вызвать инструмент. Инструменты могут делать многое. Все это кажется элегантным до первой неправильной команды, первой зависимости, установленной не в том месте, и первого токена, попадающего в журнал.

62Песочница — это взрослый способ сказать: давай, но здесь.

64## Третья часть: MCP и проблема с разъемом

66Протокол контекста модели стал одной из самых интересных частей экосистемы, поскольку он пытается стандартизировать то, что в противном случае быстро становится неуправляемым: то, как модель обнаруживает и использует внешние инструменты.

68Без стандарта каждая интеграция представляет собой маленький остров. Коннектор для GitHub сделан так, один для Slack — другой, один для баз данных с разной семантикой, один для автоматизации браузера, который выглядит ни на что.

70MCP предлагает общий язык между клиентом и сервером: инструменты, ресурсы, подсказки, авторизация, транспорт, обнаружение. Он не решает волшебным образом проблемы управления и безопасности, но дает грамматику.

72И грамматика имеет значение. Когда агент может подключиться ко многим инструментам, вопрос не просто в том, «сможет ли он это сделать?». Проблема в том, «понимает ли он, что он может сделать, в каких пределах, от имени кого и какой след оставить?».

74Для меня MCP — это не шумиха, потому что он «вызывает инструменты». Мы уже это сделали. Это хайп, потому что он смещает центр тяжести с единой интеграции на оперативный каталог инструментов.

76В хорошей агентной архитектуре MCP становится своего рода патч-панелью:

78- GitHub для кода и проблем;

79- Slack для разговорного контекста;

80- Linear или Jira для плановых работ;

81- доступная только для чтения база данных для аналитики;

82- браузер или парсер, контролируемый для внешних сайтов;

83- хранение документов;

84- изолированные среды выполнения;

85- внутренние системы подвергаются строгим разрешениям.

87Сложность заключается в том, что каталог инструментов без политики — это всего лишь более элегантный способ создать хаос.

89## Четвертая часть: личность и разрешения

91Это та область, на которую многие демо-версии закрывают глаза.

93Агент действует от чьего-либо имени. Поэтому должно быть ясно, кто является субъектом действия.

95Используются ли права пользователя? Из сервисного аккаунта? Из рабочего места? У вас есть временный или постоянный доступ? Вы можете прочитать все или только некоторые ресурсы? Можешь написать? Можете ли вы отменить? Может ли он писать реальным людям?

97Если вы плохо ответите на эти вопросы, рано или поздно у вас появится помощник с ключами от дома и без памяти о том, кто ему их дал.

99Эмпирическое правило, которое мне нравится, заключается в следующем: агент должен быть способен делать меньше, чем человек, но не больше, чем человек. А когда ему нужно сделать что-то более рискованное, он должен остановиться и спросить.

100

101Это означает OAuth, область действия токена, управление секретами, журнал аудита, политику инструментов, список разрешений, этап утверждения. Не очень романтическая вещь. Необходимые вещи.

102

103##Пятый кусок: память и контекст, но без накопления мусора

104

105Агентам нужна память, но память опасна, когда становится чердаком.

106

107Существует как минимум три типа памяти:

108

109- запустить память: что произошло в этом исполнении;

110- память проекта: условности, решения, ограничения;

111- личная или командная память: предпочтения, тон, ритуалы, процессы.

112

113Поместить все в командную строку — это ярлык. Это работает до тех пор, пока не перестанет работать. О полезной памяти нужно заботиться: индексировать, обновлять, просрочивать, проверять, делать доступной для цитирования.

114

115Агент, который плохо помнит, хуже агента, который не помнит. Потому что он говорит уверенно.

116

117Поэтому инфраструктура должна включать поиск, файлы инструкций, базу знаний, встраивание при необходимости, а также очистку. Нужна культура памяти: что входит, кто это одобряет, когда приходит в упадок, как это исправить.

118

119## Шестая часть: наблюдаемость, оценка и воспроизведение

120

121Если агент допускает ошибку, журнала «вызванная модель» недостаточно.

122

123Вы хотите увидеть маршрут. Какой контекст он получил? Какие инструменты были доступны? Какой инструмент вы выбрали? С какими аргументами? Какой ответ вы получили? Сколько это стоило? Где оно застряло? Одобрил ли человек что-нибудь? Является ли ошибка модели, инструмента, подсказки, данных или разрешения?

124

125Здесь агенты больше похожи на распределенные системы, чем на чат-ботов.

126

127Вам нужны читаемые трассировки, а не просто текстовые журналы. Вам нужно иметь возможность воспроизвести пробежку. Необходимо сравнить две версии одного и того же агента на известных задачах. Нам нужно измерить регрессию: он не только «отвечает лучше», но и «закрывает нужный тикет, не затрагивая нежелательные файлы».

128

129Агентские оценки сложнее текстовых, поскольку они включают в себя действия. Недостаточно сравнить ожидаемую строку. Вы должны учитывать последовательность действий, побочные эффекты, качество артефакта, время, стоимость, количество человеческих вмешательств.

130

131Самое смешное, что мы всегда возвращаемся к этому: разработке программного обеспечения. Тесты, окружения, трассировки, откаты. За исключением того, что код теперь тоже решает, что делать дальше.

132

133## Часть седьмая: человеческие интерфейсы

134

135Агенту не обязательно просто жить в чате.

136

137Некоторым агентам нужна доска. Другие страница со статусом и журналом. Другие кнопки «одобрить». Больше встроенных комментариев. Still others of a CLI.

138

139Пользовательский интерфейс меняет поведение. Если единственный способ контролировать агента — написать длинное сообщение, пользователь будет давать агенту расплывчатые инструкции. Однако если он видит план, различия, источники, риски и следующие действия, он может вмешаться.

140

141Достойная агентская инфраструктура включает в себя поверхности управления:

142

143- current status;

144- редактируемый план;

145- произведенные артефакты;

146- разница;

147- запросы на одобрение;

148- хронология;

149- кнопка остановки;

150- кнопка повтора;

151- видимые разрешения.

152

153Это кажется тривиальным, но это не так. Разница между «жутким ИИ» и «надежным помощником» зачастую заключается лишь в том, что последний показывает вам, где у него руки.

154

155## Ментальный стек

156

157Если бы я нарисовал это сегодня, минимальный стек агентов был бы таким:

158

1591. Модель: рассуждения, генерация, вызов инструментов, при необходимости мультимодальная.

1602. Оркестрация: цикл, шаг, планировщик, политика, участие человека в цикле.

1613. Надежная среда выполнения: рабочий процесс, очередь, повтор, пауза, возобновление.

1624. Песочница: выполнение кода, изолированная файловая система, ограничения, артефакты.

1635. Уровень инструментов: MCP, внутренний API, браузер, база данных, репозиторий.

1646. Уровень идентификации: OAuth, область действия, секрет, аудит, политика.

1657. Уровень памяти: контекст проекта, извлечение, инструкции, срок действия.

1668. Наблюдаемость: отслеживание, воспроизведение, оценка, метрики стоимости и качества.

1679. Поверхность продукта: чат, когда достаточно, информационная панель, когда это необходимо, просмотр, когда это важно.

168

169Агентская структура в основном охватывает пункт 2 и часть пункта 1. Остальное — настоящая работа.

170

171## Что бы я сделал на практике

172

173Если бы команда сказала мне: «Нам нужны агенты в производстве», я бы не стал начинать с десяти агентов.

174

175Я бы начал с небольшого, повторяющегося и наблюдаемого рабочего процесса. Например: открывать запросы на обслуживание, обновлять документацию по закрытым проблемам, готовить еженедельный обзор, сортировать повторяющиеся ошибки, создавать тесты для затронутых файлов.

176

177Тогда я бы установил очень четкие ограничения:

178

179- никакой записи без веток или песочницы;

180- никаких секретов в подсказке;

181- инструменты в белом списке;

182- человеческое одобрение внешних действий;

183- обязательная регистрация и трассировка;

184- бюджет на прогон;

185- выход всегда доступен для проверки.

186

187Только тогда я бы расширился.

188

189Агенты не терпят неудачу только потому, что модели ошибаются. Они терпят неудачу, потому что мы помещаем их в неопределенную среду, с запутанными разрешениями и театральными ожиданиями.

190

191## Мое чтение

192

193Агентская инфраструктура в лучшем смысле скучна.

194

195Это не та часть, которая заставляет вас аплодировать в демо. Это та часть, которая позволяет вам использовать демо-версию в понедельник утром с реальными людьми, реальными данными и реальными последствиями.

196

197Будущее агентов не будет решаться только тем, у кого лучший образец для подражания. Это будет решать тот, кто построит лучшее место, где он сможет работать: изолированный, когда он экспериментирует, подключенный, когда это необходимо, всегда наблюдаемый, уполномоченный критериями и достаточно скромный, чтобы остановиться, когда он не знает.

198

199Именно здесь агенты перестают быть игрушкой и становятся инфраструктурой.

200

201## Источники

202

203- [Vercel: Как создавать агенты ИИ с помощью Vercel и AI SDK] (https://vercel.com/kb/guide/how-to-build-ai-agents-with-vercel-and-the-ai-sdk)

204- [Документы Vercel: Песочница](https://vercel.com/docs/sandbox)

205- [Документация Vercel: Работа с песочницей](https://vercel.com/docs/sandbox/working-with-sandbox)

206- [Документы Vercel: MCP](https://vercel.com/docs/mcp)

207- [Протокол контекста модели: спецификация](https://modelcontextprotocol.io/specification)

208- [OpenAI: Новые инструменты для создания агентов](https://openai.com/index/new-tools-for-building-agents/)

209- [Блог Cloudflare: Агенты в Cloudflare](https://blog.cloudflare.com/agents-on-cloudflare/)

210