Сколько RAM нужно AI-агенту?

Большинству агентов, которые дёргают внешний LLM-API, нужно удивительно мало — 1–2 ГБ хватает на цикл оркестрации, очередь и небольшую БД. Тяжёлую часть (модель) считает чужой GPU. Больше RAM нужно, только если запускаете модель локально или держите много данных в памяти.

Нужен ли GPU для AI-агента?

Нет, если агент вызывает модель по API — это работа только для CPU. GPU нужен, только чтобы крутить большую модель самому, да и то малые квантованные (3B–7B) идут на CPU, просто медленно. Для большинства агентов CPU-VPS — правильный и более дешёвый выбор.

Сколько места на диске нужно AI-агенту?

15–25 ГБ покрывают ОС, код, логи и скромную БД для большинства агентов. Больше — только если храните скрапленные данные, эмбеддинги или файлы моделей (одна 7B-модель ≈ 4 ГБ).

Сколько ядер CPU нужно боту?

Одно-два ядра спокойно тянут один постоянно работающий бот или агент. 4+ ядра — когда запускаете несколько агентов параллельно, делаете CPU-нагрузку (парсинг, лёгкий локальный инференс) или обслуживаете одновременные запросы.

Самый маленький VPS, который потянет AI-агента 24/7?

1 ГБ / 2 ядра (NAT) спокойно держат типичного постоянно работающего агента или бота. Больше — только при локальной модели, высокой конкуренции или нужде в своём IP.

Сколько VPS реально нужно AI-агенту? Гайд по подбору

Честный ответ на «сколько сервера нужно моему AI-агенту?» такой: меньше, чем кажется — ровно до момента, когда внезапно нет. Весь фокус — понять, по какую сторону этой черты ваша нагрузка. Поэтому без гаданий — вот что реально потребляет каждый тип агента.

Один вопрос, который решает всё

Модель работает на вашем сервере или агент вызывает модель по API?

Если агент общается с облачной LLM (частый случай), вся умная и дорогая часть происходит на чужом железе. Ваш сервер лишь крутит цикл оркестрации: получить ввод → вызвать API → разобрать ответ → может, сходить в БД → повторить. Это легко. По-настоящему легко — 1 ГБ справляется без напряжения.

Если же модель крутится локально, всё меняется: RAM съедают веса модели, и ядер захочется по максимуму. Большинству это не нужно. Кому нужно — обычно точно знают почему (приватность, нет лимитов, офлайн). Если это вы — у нас есть отдельный гайд по self-host локальной LLM.

Подбор по типу нагрузки

Реальные цифры, по которым можно действовать:

Нагрузка	RAM	vCPU	Диск	Заметка
Чат/ассистент-агент (через API)	1 ГБ	2	15 ГБ	Цикл крошечный, модель удалённая
Скрапер / дата-агент	2 ГБ	2	25 ГБ	Запас под парсинг + данные
Торговый бот	1–2 ГБ	2	15–25 ГБ	Важнее задержка, чем размер — см. гайд по торговым ботам
Несколько агентов параллельно	4 ГБ	4	35 ГБ	Каждый дешёвый, но в сумме набегает
Локальная LLM 3B–7B (квантованная)	4–6 ГБ	4–6	25–45 ГБ	Только CPU, в читаемом темпе, не для объёма

Закономерность: агенты на API — крошечные; единственное тяжёлое — локальные модели.

Где CPU-сервер заканчивается

Скажем прямо про потолок: наши тарифы упираются в 6 ГБ RAM и 6 ядер, только CPU — без GPU. Это покрывает всё из таблицы выше, включая 7B-модель локально для себя. Чего НЕ покрывает: модели 13B+, высокопоточный локальный инференс и всё, чему реально нужен GPU. Если это ваша задача — CPU-VPS (наш или любой) неподходящий инструмент, и лучше знать это сейчас, а не после деплоя.

Для 95% агентов, что ходят в API, это вообще не проблема. Им хорошо на самом маленьком сервере.

Практическое правило

Просто агент, что вызывает API? Старт с 1 ГБ / 2 ядра. Потом можно увеличить.
Скрапинг или хранение данных? 2 ГБ и диск побольше.
Несколько агентов или малая локальная модель? 4–6 ГБ и 4+ ядра.
Нужен GPU? Другая категория — не впихивайте на CPU.

Не берите с запасом «на всякий случай». Агенты по природе лёгкие; цена слишком маленького сервера — один ресайз, а цена слишком большого — оплата простаивающей RAM каждый месяц.

Когда выбрали размер — агент может арендовать сервер сам через MCP, либо закажете за минуту на сайте. В любом случае — начинайте с малого: почти наверняка вам нужно меньше, чем ожидалось.

Сколько VPS реально нужно AI-агенту? Гайд по подбору

Один вопрос, который решает всё

Подбор по типу нагрузки

Где CPU-сервер заканчивается

Практическое правило

FAQ