EQVPS

Сколько VPS реально нужно AI-агенту? Гайд по подбору

Jun 15, 2026 · 2 min read · EQVPS Team

Честный ответ на «сколько сервера нужно моему AI-агенту?» такой: меньше, чем кажется — ровно до момента, когда внезапно нет. Весь фокус — понять, по какую сторону этой черты ваша нагрузка. Поэтому без гаданий — вот что реально потребляет каждый тип агента.

Один вопрос, который решает всё

Модель работает на вашем сервере или агент вызывает модель по API?

Если агент общается с облачной LLM (частый случай), вся умная и дорогая часть происходит на чужом железе. Ваш сервер лишь крутит цикл оркестрации: получить ввод → вызвать API → разобрать ответ → может, сходить в БД → повторить. Это легко. По-настоящему легко — 1 ГБ справляется без напряжения.

Если же модель крутится локально, всё меняется: RAM съедают веса модели, и ядер захочется по максимуму. Большинству это не нужно. Кому нужно — обычно точно знают почему (приватность, нет лимитов, офлайн). Если это вы — у нас есть отдельный гайд по self-host локальной LLM.

Подбор по типу нагрузки

Реальные цифры, по которым можно действовать:

НагрузкаRAMvCPUДискЗаметка
Чат/ассистент-агент (через API)1 ГБ215 ГБЦикл крошечный, модель удалённая
Скрапер / дата-агент2 ГБ225 ГБЗапас под парсинг + данные
Торговый бот1–2 ГБ215–25 ГБВажнее задержка, чем размер — см. гайд по торговым ботам
Несколько агентов параллельно4 ГБ435 ГБКаждый дешёвый, но в сумме набегает
Локальная LLM 3B–7B (квантованная)4–6 ГБ4–625–45 ГБТолько CPU, в читаемом темпе, не для объёма

Закономерность: агенты на API — крошечные; единственное тяжёлое — локальные модели.

Где CPU-сервер заканчивается

Скажем прямо про потолок: наши тарифы упираются в 6 ГБ RAM и 6 ядер, только CPU — без GPU. Это покрывает всё из таблицы выше, включая 7B-модель локально для себя. Чего НЕ покрывает: модели 13B+, высокопоточный локальный инференс и всё, чему реально нужен GPU. Если это ваша задача — CPU-VPS (наш или любой) неподходящий инструмент, и лучше знать это сейчас, а не после деплоя.

Для 95% агентов, что ходят в API, это вообще не проблема. Им хорошо на самом маленьком сервере.

Практическое правило

Не берите с запасом «на всякий случай». Агенты по природе лёгкие; цена слишком маленького сервера — один ресайз, а цена слишком большого — оплата простаивающей RAM каждый месяц.

Когда выбрали размер — агент может арендовать сервер сам через MCP, либо закажете за минуту на сайте. В любом случае — начинайте с малого: почти наверняка вам нужно меньше, чем ожидалось.

FAQ

Сколько RAM нужно AI-агенту?

Большинству агентов, которые дёргают внешний LLM-API, нужно удивительно мало — 1–2 ГБ хватает на цикл оркестрации, очередь и небольшую БД. Тяжёлую часть (модель) считает чужой GPU. Больше RAM нужно, только если запускаете модель локально или держите много данных в памяти.

Нужен ли GPU для AI-агента?

Нет, если агент вызывает модель по API — это работа только для CPU. GPU нужен, только чтобы крутить большую модель самому, да и то малые квантованные (3B–7B) идут на CPU, просто медленно. Для большинства агентов CPU-VPS — правильный и более дешёвый выбор.

Сколько места на диске нужно AI-агенту?

15–25 ГБ покрывают ОС, код, логи и скромную БД для большинства агентов. Больше — только если храните скрапленные данные, эмбеддинги или файлы моделей (одна 7B-модель ≈ 4 ГБ).

Сколько ядер CPU нужно боту?

Одно-два ядра спокойно тянут один постоянно работающий бот или агент. 4+ ядра — когда запускаете несколько агентов параллельно, делаете CPU-нагрузку (парсинг, лёгкий локальный инференс) или обслуживаете одновременные запросы.

Самый маленький VPS, который потянет AI-агента 24/7?

1 ГБ / 2 ядра (NAT) спокойно держат типичного постоянно работающего агента или бота. Больше — только при локальной модели, высокой конкуренции или нужде в своём IP.

← Back to blogSee plans & pricing →