EQVPS

VPS для веб-скрейпінгу: встановлення, підбір ресурсів і чесні ліміти

Jul 6, 2026 · 4 min read · EQVPS Team

Скрейпер на ноутбуці добрий рівно до моменту, коли ви закриєте його посеред прогону, домашній IP спіймає ліміт, або ви захочете, щоб задача йшла щогодини незалежно від того, спите ви чи ні. Переїзд на VPS вирішує всі три: він онлайн 24/7, не палить репутацію домашнього IP, а cron чи systemd-таймер запускають його за розкладом без вас. Розберемо, як це налаштувати, скільки сервера реально потрібно і що більшість гайдів тихо пропускає.

Чому VPS кращий за вашу машину

Стек і що кожній частині потрібно

Дві дуже різні вагові категорії, і невірний тариф або марнує гроші, або душить задачу:

Правило: ваш код майже ніколи не вузьке місце — Chromium вузьке. Рахуйте під браузер, не під скрейпер.

Розклад: systemd-таймер замість cron

cron працює, але systemd-таймер — кращий дефолт на сервері, який ви обслуговуєте: логи через journalctl, автодогін якщо сервер був вимкнений, і статус кожного запуску. Мінімальне налаштування:

# /etc/systemd/system/scrape.service
[Unit]
Description=Run scraper
[Service]
Type=oneshot
User=scraper
WorkingDirectory=/home/scraper/job
ExecStart=/home/scraper/job/venv/bin/python scrape.py
# /etc/systemd/system/scrape.timer
[Unit]
Description=Hourly scrape
[Timer]
OnCalendar=hourly
Persistent=true
[Install]
WantedBy=timers.target
sudo systemctl enable --now scrape.timer
journalctl -u scrape.service -f   # дивитися запуски

Persistent=true — те, чого cron не вміє: якщо сервер був вимкнений у момент запуску, задача виконається один раз при завантаженні, а не мовчки пропуститься.

Куди складати результати

Простіше й за обсягом: SQLite для структурованих даних, які запитуватимете (один файл, нуль налаштування), CSV для швидких табличних вивантажень або S3-сумісне об'єктне сховище, коли результати переростають сервер або їх хочеться тримати поза ним. Ротуйте логи (logrotate або ліміти journald), щоб балакучий скрейпер не забив диск.

Чесна частина: вихідний IP і репутація

Саме ця деталь вирішує, чи пропрацює ваш скрейпер тиждень, чи спіймає блок на перший день.

На NAT-тарифі вихідний трафік ділить один egress-IP з іншими клієнтами. Репутація цього IP спільна — сусід, що скрейпить ту саму ціль, може підвести адресу під ліміт раніше, ніж ви відправите перший запит. Годиться для легкого рідкого скрейпінгу; на обсязі — ризик.

Виділений IP дає власну репутацію вихідного — поведінка інших на неї не впливає. Але це палиця з двома кінцями: агресивний скрейпінг палить ваш власний чистий IP, і щойно ціль його заблокувала — він заблокований. Виділений IP — це контроль, не імунітет.

На реальному масштабі потрібні зовнішні пули проксі. Жоден IP — спільний чи виділений — не розмаже навантаження по багатьох адресах, а саме це потрібно серйозному скрейпінгу проти цілей із лімітом за IP. Проксі — сторонній шар, який ви додаєте зверху: VPS ганяє скрейпер, пул проксі дає адреси. Не чекайте, що один IP сервера зробить роботу пулу проксі.

Етика і AUP — не опціонально

Скрейпінг живе в правовій та етичній сірій зоні, тому без ілюзій:

Підсумок

VPS — правильний дім для скрейпера: завжди онлайн, за розкладом і поза домашнім IP. Підбирайте тариф під стек — Nano за $3 для httpx, Micro за $5 – Small за $8 для Playwright — плануйте systemd-таймером і будьте чесні про IP: спільний egress ділить репутацію, виділений IP ваш — будувати чи палити, а реальний масштаб означає пули проксі. Спершу закрийте сервер чек-листом безпеки, підберіть розмір за гайдом із підбору VPS, а якщо важлива приватність оплати без картки — розбір анонімного VPS чесна версія. Скрейпте відповідально — AUP реальний.

FAQ

Які характеристики VPS потрібні для скрейпінгу?

Залежить від стека. Звичайний HTTP-скрейпер (httpx/requests по API чи статичному HTML) легкий — Nano за $3 з 1 ГБ вистачає із запасом. Щойно потрібен справжній браузер для JS-важких сайтів, Playwright з headless Chromium хоче 2–4 ГБ: Micro за $5 під один-два контексти браузера, Small за $8 якщо ганяєте кілька паралельно. Оперативку їсть Chromium, не ваш код.

Можна скрейпити з IP самого сервера чи потрібні проксі?

Для невеликих обсягів і ввічливого скрейпінгу сайтів, що це допускають, IP сервера підійде. На масштабі або проти сайтів із лімітом за IP знадобиться зовнішній пул проксі — один IP (спільний чи виділений) не розмаже навантаження, а довбання з однієї адреси швидко призводить до блокування. Виділений IP дає чисту репутацію під вашим контролем; проксі дають багато адрес.

cron чи systemd-таймер для скрейпів за розкладом?

Майже завжди systemd-таймер. На відміну від cron він дає нормальне логування через journalctl, порядок залежностей, автодогін якщо сервер був вимкнений, і статус кожного запуску. cron ще годиться для зовсім простих задач, але таймер — кращий дефолт на сервері, який ви реально обслуговуєте.

Чи дозволений веб-скрейпінг на VPS?

Легальний, шанобливий скрейпінг — так. Агресивний, що ігнорує ліміти й robots.txt, або перетворює ціль на відмову в обслуговуванні — порушення правил використання, що веде до припинення послуги. Скрейпте те, що дозволено, обмежуйте себе й не перетворюйте скрейпер на атаку.

← Back to blogSee plans & pricing →