Question 1

Какие модели можно запустить?

Accepted Answer

Любые. LLM (Llama, Mistral, GPT-серия), генерация изображений (Stable Diffusion, Flux), аудио (Whisper), embeddings, кастомные файнтюны. Скажите что нужно — развернём.

Question 2

Сколько стоит?

Accepted Answer

Оплата за фактическое использование: по токенам для LLM, по запросам для vision/audio. Нет запросов — нет оплаты. Минимальный тариф от 990₽/мес.

Question 3

Как быстро развернёте мою модель?

Accepted Answer

Популярные модели (Llama, SD, Whisper) — за несколько часов. Кастомный файнтюн — до 24 часов. Сложные пайплайны — обсуждаем отдельно.

Question 4

Есть ли лимиты на количество запросов?

Accepted Answer

По умолчанию — 100 RPS. Нужно больше — масштабируем кластер. Rate limiting настраивается под вас.

Question 5

Данные остаются у вас?

Accepted Answer

Логи хранятся 30 дней и доступны только вам. По запросу — шифрование данных и размещение на изолированном кластере.

Инференс AI-моделей

Возможности

Интеграции

Вопросы и ответы