Честный ответ на «сколько сервера нужно моему AI-агенту?» такой: меньше, чем кажется — ровно до момента, когда внезапно нет. Весь фокус — понять, по какую сторону этой черты ваша нагрузка. Поэтому без гаданий — вот что реально потребляет каждый тип агента.
Один вопрос, который решает всё
Модель работает на вашем сервере или агент вызывает модель по API?
Если агент общается с облачной LLM (частый случай), вся умная и дорогая часть происходит на чужом железе. Ваш сервер лишь крутит цикл оркестрации: получить ввод → вызвать API → разобрать ответ → может, сходить в БД → повторить. Это легко. По-настоящему легко — 1 ГБ справляется без напряжения.
Если же модель крутится локально, всё меняется: RAM съедают веса модели, и ядер захочется по максимуму. Большинству это не нужно. Кому нужно — обычно точно знают почему (приватность, нет лимитов, офлайн). Если это вы — у нас есть отдельный гайд по self-host локальной LLM.
Подбор по типу нагрузки
Реальные цифры, по которым можно действовать:
| Нагрузка | RAM | vCPU | Диск | Заметка |
|---|---|---|---|---|
| Чат/ассистент-агент (через API) | 1 ГБ | 2 | 15 ГБ | Цикл крошечный, модель удалённая |
| Скрапер / дата-агент | 2 ГБ | 2 | 25 ГБ | Запас под парсинг + данные |
| Торговый бот | 1–2 ГБ | 2 | 15–25 ГБ | Важнее задержка, чем размер — см. гайд по торговым ботам |
| Несколько агентов параллельно | 4 ГБ | 4 | 35 ГБ | Каждый дешёвый, но в сумме набегает |
| Локальная LLM 3B–7B (квантованная) | 4–6 ГБ | 4–6 | 25–45 ГБ | Только CPU, в читаемом темпе, не для объёма |
Закономерность: агенты на API — крошечные; единственное тяжёлое — локальные модели.
Где CPU-сервер заканчивается
Скажем прямо про потолок: наши тарифы упираются в 6 ГБ RAM и 6 ядер, только CPU — без GPU. Это покрывает всё из таблицы выше, включая 7B-модель локально для себя. Чего НЕ покрывает: модели 13B+, высокопоточный локальный инференс и всё, чему реально нужен GPU. Если это ваша задача — CPU-VPS (наш или любой) неподходящий инструмент, и лучше знать это сейчас, а не после деплоя.
Для 95% агентов, что ходят в API, это вообще не проблема. Им хорошо на самом маленьком сервере.
Практическое правило
- Просто агент, что вызывает API? Старт с 1 ГБ / 2 ядра. Потом можно увеличить.
- Скрапинг или хранение данных? 2 ГБ и диск побольше.
- Несколько агентов или малая локальная модель? 4–6 ГБ и 4+ ядра.
- Нужен GPU? Другая категория — не впихивайте на CPU.
Не берите с запасом «на всякий случай». Агенты по природе лёгкие; цена слишком маленького сервера — один ресайз, а цена слишком большого — оплата простаивающей RAM каждый месяц.
Когда выбрали размер — агент может арендовать сервер сам через MCP, либо закажете за минуту на сайте. В любом случае — начинайте с малого: почти наверняка вам нужно меньше, чем ожидалось.