Крупный онлайн-сервис терял деньги на каждой минуте простоя базы данных и решил построить кластер высокой доступности.
ЗадачаТребовалась схема, при которой отказ любого сервера или пути к данным не приводит к остановке сервиса.
Что подобралиСделали два симметричных узла на EPYC, подключённых к общей all-flash СХД по двум независимым путям, с резервированной сетью 25G.
- Два узла EPYC с большим числом ядер под нагрузку БД
- All-flash СХД с двумя контроллерами
- Полное дублирование путей данных и сети
Проектная спеццена от производителя на СХД и серверы, отгрузка комплекта за 10 дней под жёсткий дедлайн запуска.
РезультатКластер прошёл тесты с отключением узлов без потери сервиса — заказчик получил отказоустойчивость уровня, который раньше казался недостижимым по бюджету.