Собственный ЦОД вместо публичного IaaS: TCO в 10 раз ниже и полный контроль над данными
Перешли с SAN/NAS и публичного IaaS на гиперконвергентную платформу: 800+ виртуальных серверов, 1 ПБ+ хранилища, два домена отказа, специализированное железо под высоконагруженные БД, 1С и Data Lake
О ПРОЕКТЕ
ИТ-платформа крупного ритейл-оператора
Крупный ритейл-оператор эксплуатирует сотни информационных систем — от высоконагруженных баз данных и 1С до Data Lake и корпоративных сервисов. ИТ-инфраструктура обслуживает все операционные процессы компании: логистику, торговые точки, управляющие офисы и центры обработки данных. До модернизации платформа работала на SAN/NAS, а часть сервисов вынуждена была размещаться в публичном IaaS
ЗАДАЧИ ПРОЕКТА
Что необходимо было реализовать
Серверная инфраструктура на базе SAN/NAS упёрлась в потолок производительности и масштабирования, а вынужденный уход в публичный IaaS дал стоимостный и архитектурный тупик. Требовалось построить собственную платформу, которая будет одновременно масштабируемой, безопасной и подходящей под профили нагрузки бизнеса:
ВЫЗОВЫ
IT-инфраструктура достигла архитектурного потолка
Главная сложность была в том, что предыдущая модель упёрлась в потолок одновременно по производительности, отказоустойчивости и экономике. Дальнейшее масштабирование на SAN/NAS и публичном IaaS было дорого и архитектурно тупиково
СХД — единая точка отказа
Системы хранения данных стали узким местом по производительности и единой точкой отказа для всей платформы
Облако под усреднённые задачи
Публичный IaaS не давал нужной производительности для БД, 1С и Data Lake — облако строится под усреднённые нагрузки
Данные на стороне
Часть данных компании находилась на сторонней инфраструктуре, что не позволяло быстро реагировать на угрозы
Экономика IaaS не сходилась
При росте нагрузки стоимость публичного облака масштабировалась быстрее, чем сами сервисы
ХОД РАБОТЫ
Как построили
Платформа собиралась с учётом реальных профилей нагрузки и параллельным выводом сервисов из публичного IaaS. Команда вела миграцию по группам сервисов, чтобы не создавать долгих окон обслуживания:
Гиперконвергентная архитектура
Выбрана гиперконвергентная схема с программно-определяемым хранилищем: каждый сервер одновременно выполняет вычислительные функции и участвует в распределённом хранилище. Это исключает выделенные СХД как единую точку отказа
Подбор оборудования под нагрузки
Для каждой группы сервисов подобрано оборудование под профиль нагрузки — высоконагруженные БД, 1С и Data Lake работают на специализированном железе. Многоуровневая дисковая подсистема: NVMe для самых горячих нагрузок, SSD для оперативных задач, SAS для архивных
Миграция и возврат сервисов
Сервисы из публичного IaaS поэтапно возвращены на собственную платформу. IT-инфраструктура построена с двумя доменами отказа — отказ любого компонента не прерывает работу систем. Архитектура готова к расширению в катастрофоустойчивый вариант с двумя ЦОД
РЕЗУЛЬТАТЫ
Управляемая платформа под полным контролем компании
TCO в 10 раз ниже IaaS
Стоимость владения собственной платформой оказалась на порядок ниже эксплуатации эквивалентного публичного IaaS
800+ ВМ · 1 ПБ+ хранилища
Вся продуктовая IT-инфраструктура работает на единой гиперконвергентной платформе под управлением компании
99.9% доступность
Два домена отказа на уровне архитектуры — отказ любого компонента не останавливает работу систем
100% данных у себя
Все данные компании размещены на собственной инфраструктуре — вне публичных облаков
Железо под нагрузки
Высоконагруженные БД, 1С и Data Lake работают на оборудовании, подобранном под профиль каждой нагрузки
Готовность к гео-резерву
Архитектура расширяется в катастрофоустойчивый вариант с двумя ЦОД без смены модели
Итог
Компания вышла из публичного IaaS и получила собственную масштабируемую платформу с TCO в 10 раз ниже
Сервисы возвращены на собственную инфраструктуру с полным контролем над данными, выделенные СХД как единая точка отказа исключены, оборудование подобрано под профили нагрузки, а архитектура готова к масштабированию в катастрофоустойчивый вариант с двумя ЦОД. Поддержка 24/7 дежурными системными инженерами