EQVPS

Скільки VPS насправді потрібно AI-агенту? Гайд із підбору

Jun 15, 2026 · 2 min read · EQVPS Team

Чесна відповідь на «скільки сервера потрібно моєму AI-агенту?» така: менше, ніж здається — рівно до миті, коли раптом ні. Весь фокус — зрозуміти, по який бік цієї межі ваше навантаження. Тож без гадань — ось що реально споживає кожен тип агента.

Одне питання, що вирішує все

Модель працює на вашому сервері чи агент викликає модель по API?

Якщо агент спілкується з хмарною LLM (частий випадок), уся розумна й дорога частина відбувається на чужому залізі. Ваш сервер лише крутить цикл оркестрації: отримати ввід → викликати API → розібрати відповідь → може, сходити в БД → повторити. Це легко. По-справжньому легко — 1 ГБ справляється без напруги.

Якщо ж модель крутиться локально, усе змінюється: RAM з'їдають ваги моделі, і ядер захочеться по максимуму. Більшості це не потрібно. Кому потрібно — зазвичай точно знають чому (приватність, немає лімітів, офлайн). Якщо це ви — у нас є окремий гайд із self-host локальної LLM.

Підбір за типом навантаження

Реальні цифри, за якими можна діяти:

НавантаженняRAMvCPUДискНотатка
Чат/асистент-агент (через API)1 ГБ215 ГБЦикл крихітний, модель віддалена
Скрапер / дата-агент2 ГБ225 ГБЗапас під парсинг + дані
Торговий бот1–2 ГБ215–25 ГБВажливіша затримка, ніж розмір — див. гайд по торгових ботах
Кілька агентів паралельно4 ГБ435 ГБКожен дешевий, але в сумі набігає
Локальна LLM 3B–7B (квантована)4–6 ГБ4–625–45 ГБЛише CPU, у читабельному темпі, не для обсягу

Закономірність: агенти на API — крихітні; єдине важке — локальні моделі.

Де CPU-сервер закінчується

Скажемо прямо про стелю: наші тарифи впираються в 6 ГБ RAM і 6 ядер, лише CPU — без GPU. Це покриває все з таблиці вище, включно з 7B-моделлю локально для себе. Чого НЕ покриває: моделі 13B+, високопотоковий локальний інференс і все, чому реально потрібен GPU. Якщо це ваша задача — CPU-VPS (наш чи будь-який) невідповідний інструмент, і краще знати це зараз, а не після деплою.

Для 95% агентів, що ходять в API, це взагалі не проблема. Їм добре на найменшому сервері.

Практичне правило

Не беріть із запасом «про всяк випадок». Агенти за природою легкі; ціна замалого сервера — один ресайз, а ціна завеликого — оплата простоюючої RAM щомісяця.

Коли обрали розмір — агент може орендувати сервер сам через MCP, або замовите за хвилину на сайті. У будь-якому разі — починайте з малого: майже напевно вам потрібно менше, ніж очікувалося.

FAQ

Скільки RAM потрібно AI-агенту?

Більшості агентів, що смикають зовнішній LLM-API, потрібно напрочуд мало — 1–2 ГБ вистачає на цикл оркестрації, чергу й невелику БД. Важку частину (модель) рахує чужий GPU. Більше RAM треба, лише якщо запускаєте модель локально або тримаєте багато даних у пам'яті.

Чи потрібен GPU для AI-агента?

Ні, якщо агент викликає модель по API — це робота лише для CPU. GPU потрібен, тільки щоб крутити велику модель самому, та й то малі квантовані (3B–7B) йдуть на CPU, просто повільно. Для більшості агентів CPU-VPS — правильний і дешевший вибір.

Скільки місця на диску потрібно AI-агенту?

15–25 ГБ покривають ОС, код, логи й скромну БД для більшості агентів. Більше — лише якщо зберігаєте скраплені дані, ембединги чи файли моделей (одна 7B-модель ≈ 4 ГБ).

Скільки ядер CPU потрібно боту?

Одне-два ядра спокійно тягнуть один постійно працюючий бот чи агент. 4+ ядра — коли запускаєте кілька агентів паралельно, робите CPU-навантаження (парсинг, легкий локальний інференс) або обслуговуєте одночасні запити.

Найменший VPS, що потягне AI-агента 24/7?

1 ГБ / 2 ядра (NAT) спокійно тримають типового постійно працюючого агента чи бота. Більше — лише за локальної моделі, високої конкуренції чи потреби у власному IP.

← Back to blogSee plans & pricing →