Сервер для AI-инференса (2× NVIDIA A100)

362361
3730750,00
р.
4200140,00
р.
Назначение
Готовое решение для запуска моделей типа ChatGPT, LLaMA, StableLM, генерации текста, голосовых ассистентов, внутренних ИИ-систем в компании. Идеально подходит для компаний, которым важно:
  • не зависеть от облаков и внешних API
  • держать данные внутри организации
  • получить ИИ-инфраструктуру под ключ с установкой и поддержкой

Конфигурация оборудования
Форм-фактор: 2U (стойка)
CPU: 2× Intel Xeon Silver
ОЗУ: 256 GB ECC DDR4
Накопители: 2× NVMe 2TB
GPU: 2× NVIDIA A100 40GB PCIe
Сеть: 2× 10GbE (Intel X550-T2 или Mellanox ConnectX-4)
Удалённое управление: BMC с KVM/IPMI

Предустановленное ПО
  • Ubuntu Server 22.04 LTS
  • NVIDIA CUDA Toolkit
  • Docker
  • TorchServe (API-платформа для моделей PyTorch)
  • HuggingFace Transformers
  • Мониторинг: Prometheus + Grafana (по запросу)

Сервис и сопровождение
  • Первичная настройка и тестирование включены
  • Поддержка по e-mail/Telegram — 3 месяца бесплатно
  • Опционально: расширенная гарантия на 3 или 5 лет
  • Возможна аренда сервера для теста на 14 дней

Стоимость
Цена (с DDP Москва + предустановкой): 3 748 800 ₽
Гарантия 3 года: + 187 440 ₽
Гарантия 5 лет: + 374 880 ₽
Настройка и сопровождение (SLA на 3 года): + 749 760 ₽

Почему именно это решение
  • Работаем напрямую с ODM (Inspur, Supermicro, Gigabyte)
  • Собираем серверы под задачи заказчика
  • Поддерживаем доставку и сопровождение по всей РФ
  • Предлагаем альтернативу облакам с понятной экономикой

Условия поставки
  • Срок отгрузки: 2–3 недели с момента оплаты
  • Поставка DDP (включено всё: таможня, логистика, сертификаты)
  • Доступен договор поставки с юр. лицом, оплата с НДС