Внедрение Lakehouse-платформы Data Ocean Nova в Альфа-Банк

Заказчик:
Альфа-Банк
Руководитель проекта со стороны заказчика
Поставщик
Data Sapience
Год завершения проекта
2025
Сроки выполнения проекта
апрель, 2024 — ноябрь, 2025
Масштаб проекта
10000 человеко-часов
Цели

Импортозамещение старой big data на базе сборки Clouder-a

В среднем поток изменений данных, загружаемых в Lakehouse, после внедрения Data Ocean Nova составляет 7 000 RPS Upsert операций с продолжительными пиковыми значениями до 15 000 RPS. Больше 200 таблиц загружаются онлайн в режиме Upsert. На данный момент в системе суммарно ~600 Тб сжатых полезных данных в S3. Текущие мощности решения рассчитаны на хранение 2,4 Пб данных в сжатом виде, и с учетом планов 2025-2026 года по миграции Hadoop кластеров и Oracle Exadata в Data Ocean Nova планируется расширение до 6 Пб в течение полутора лет. Производительность объектного хранилища S3 в настоящий момент составляет 45/70 (Put/Get) гигабайт/с, что позволяет обеспечить все бизнес требования большого количества пользователей и сервисов. Объектное хранилище развернуто в отказоустойчивой геораспределенной конфигурации.

Уникальность проекта

Внедрение Data Ocean Nova в IT-инфраструктуру Альфа-Банка позволило решить задачи Real-time Data Hub. Благодаря интеграции Lakehouse-платформы стало возможным получать оперативные изменения из 200+ систем, сократился зоопарк технологий и понизилась стоимость IT-инфраструктуры банка. Данные из разных источников теперь агрегируются в одном хранилище и в едином формате. Пользователи могут обращаться к оперативным данным хаба для проверки гипотез (ad-hoc анализ над real-time ODS) и строить онлайн-отчетность над ODS. Были обеспечены предоставление data-сервисов, обучение моделей и проверка их функциональности.

Использованное ПО

Решение Data Ocean Nova – первая российская Lakehouse-платформа данных нового поколения, представленная отечественным вендором Data Sapience, доказав свою высокую эффективность, было внедрено в инфраструктуру Альфа-Банка на промышленной основе.

Data Ocean Nova – универсальная Lakehouse-платформа данных нового поколения, представленная вендором Data Sapience. Продукт решает комплексные задачи массивно-параллельной обработки данных. В том числе позволяет создавать и масштабировать оперативные слои данных в реальном времени, бесшовно работать с CRM- и ML-платформами, предоставлять федеративный доступ к базам данных и выступает в качестве виртуального хранилища. Поддерживает on-premise инсталляцию, частное облако и гибридный сценарий использования, а также Multi-tenant развертывание для создания изолированных сред на базе общей инфраструктуры.

Сложность реализации

При выборе платформы данных Альфа-Банк руководствовался определенными требованиями. Решение должно поддерживать масштабирование оперативного слоя данных и предоставлять возможность изолирования ресурсов на регламентные процессы и аналитические задачи с поддержкой мультитенантности в одном кластере. Также платформа должна обладать инструментами разработки собственных приложений для работы с данными, иметь высокопроизводительный и высококонкурентный MPP-движок для SQL ELT, решать задачи DWH и Data Lake одновременно. Обновление всех компонент должны быть независимым. Решение должно разворачиваться в окружении Kubernetes, обладать высокой отказоустойчивостью и возможностью гетерогенной работы из коробки. Важным также являлось следование современной архитектурной парадигме разделения compute и storage слоев. Lakehouse-платформа Data Ocean Nova обладает всеми перечисленными требованиями, поэтому выбор банка остановился на ней.

Описание проекта

Начиная с 2023 года Альфа Банк пилотировал и искал платформу больших данных для импортозамещения старой big data на базе сборки Clouder-a. В 2025 г. решение Data Ocean Nova – первая российская Lakehouse-платформа данных нового поколения, представленная отечественным вендором Data Sapience, доказав свою высокую эффективность, было внедрено в инфраструктуру Альфа-Банка на промышленной основе. Среди предпосылок для интеграции можно выделить: потребность в загрузке данных и формирование отчетов в режиме NRT, а также накапливать историю изменений состояния источников при условии, что источники данных нельзя нагружать.

География проекта

Только РФ

Коментарии: 20

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Сергей Исаев
    GlowByte
    Директор по продажам
    01.12.2025 12:54

    Подскажите, что пользователям дал переход на новую платформу?

    • Александр Заболоцкий Сергей
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      18.12.2025 17:08

      Добрый, день. Так как вся система развернута в кластере кубернетес, пользователи имеют гарантированные выделенные высичлительные ресурсы для своих групп или бизнес-доменов (вендор называет это мультитенантность). Производительность их функионала теперь зависит только от них самих. Второй момент который они отмечают - разнообразие вычислительных сервисов что позволяет им решить все задачи в одноу платформе без дублирования данных по разным системам

  • Иван Котляровский
    Рейтинг: 240
    СПАО “Ингосстрах”
    Руководитель направления Управления сопровождения урегулирования
    01.12.2025 12:56

    Александр, добрый день! У вас платформа развернута в концепции раздельных вычислений?

    • Александр Заболоцкий Иван
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      18.12.2025 17:09

      Здравствуйте, Иван. Ответ на вопрос - Да. Мы изначально ориентировались на раздельное аппратное обеспечение compute и storage: кластер узлов одного типа для хранения и кластер узлов другого типа для вычислений с общей сетью. При этом все вендорское ПО (и storage и compute) устанваливаются в общем kubernetes кластере.

  • Сергей Черномырдин
    Рейтинг: 10
    ПАО Магнит
    Руководитель
    01.12.2025 17:25

    Подскажите, какое среднее время задержки данных от источника до приемника в вашем решении?

    • Александр Заболоцкий Сергей
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      18.12.2025 17:11

      Мы выдерживаем требования отставания события в lakehouse-систему с отставанием не более 5 мин в пиковые моменнты нагрузки (закрытие операционного дня в основной банковской АБС), но в обычное регламентное время задержки могут быть всего 15 секунд

  • Евгений Вилков
    Рейтинг: 18
    Databorn
    IT Director
    12.12.2025 14:47

    Какое количество систем-источников из заявленных 200+ обновляется в настоящий момент в режиме реального времени в целевой платформе?

    • Александр Заболоцкий Евгений
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      18.12.2025 17:14

      Добрый день, спасибо за вопрос. В настоящий момент напрямую интегрировано примерно 50 БД источников из планируемых 200. То есть мы напрямую читаем транзаккционные журналы и пишим изменения в lakehouse-платформу данных Data Ocean Nova. Главная АБС интегрированна не напрямую через CDC, а через Kafka так как у нас это было общебанковским решением и оттуда приходит инкремент данных 2 Тб в сутки который фиксируется в платформу раз в 5-10 минут (в зависимости от объекта)

  • Елизавета Рощина
    Рейтинг: 12
    ООО Дата Сапиенс
    PR-менеджер
    12.12.2025 15:05

    Последние лет 5 понятие по-настоящему цифрового банка у меня ассоциируется именно с АБ. Только запуская такие смелые и амбициозные проекты, можно иметь гандикап на конкурентной рынке

    • Александр Заболоцкий Елизавета
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      18.12.2025 17:17

      Спасибо! Внутри команды банка есть полное взаимопонимание того, что на конкурентном банковском розничном рынке необходимо быть на шаг впереди в плане технологического превосходства в вопросах принятия решений на основе данных.

  • Олег Молчанов
    Рейтинг: 22
    Магнит
    Руководитель направления по метаданным и качеству данных
    23.12.2025 16:41

    Какое решение по созданию объектного хранилища вы внедрили? Это ПАК?

    • Александр Заболоцкий Олег
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      23.12.2025 22:11

      Мы не используем програмно-аппаратный компекс. Вендор подготовил сайзинг аппаратного обеспечения в соотвествии с нашими потребностями и планами развития и предоставляем своую сборку програмного решения по реализации фкнции S3 хранилища на базе ПО minio (вендорский форк)

  • Ирина Селезнева
    Рейтинг: 6
    ООО Современные технологии заземления
    руководитель отдела маркетинга
    25.12.2025 12:56

    Видела ваши доклады на публичных мероприятиях. Понравилось, что с каждым выступлением вы добавляете к рассказу о вашем проекте деталей и нюансов, которые изменились с последней публикации. Интересно наблюдать за процессом выстраивания новой аналитической инфраструктуры. Пожалуйста, поддерживайте и дальше наш интерес и делитесь подробностями!

    • Александр Заболоцкий Ирина
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      25.12.2025 14:02

      Спасибо большое, Ирина. Будем стараться держать в курсе обо всех наших изменениях. Быть в чем то первым с точки зрения аппробации технологии в реальной правтической плоскости - это всегда определенная отвественность которую ты на себя принимаешь. Постараемся держать в курсе и рассказывать не только об успехах но и о неудучах и просчетах, если они будут случаться.

  • Ирина Селезнева
    Рейтинг: 6
    ООО Современные технологии заземления
    руководитель отдела маркетинга
    25.12.2025 14:52

    Я читала, что внедряемое вами вендорское решение предполагает несколько вычислительных технологий. Какими технологиями пользуются ваша команда и пользователи?

    • Александр Заболоцкий Ирина
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      25.12.2025 16:07

      В старой архитектуре на базе Cloudera Hadoop мы активно использовали Spark и Impala и теперь перенесли свой опыт в новую lakehouse платформу данных. Для ad-hoc доступа мы используем все вычислительные технологии доступные в Data Ocean Nova, в том числе и Trino. На будущий год планируем протестировать новый вычислительный движок платформы - StarRocks

  • Дмитрий Власов
    Рейтинг: 26
    Магнит (АО«Тандер»)
    Руководитель управления по администрированию данных
    25.12.2025 17:19

    Когда по плану вы планируете полностью отказаться от легаси-систем аналитического хранилища?

    • Александр Заболоцкий Дмитрий
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      25.12.2025 17:24

      Не так давно в формате выстулпения на конференции мы публично озвучили планы по этапности и срокам миграции. Согласно им мы планируем в течение полутора лет полностью отказаться от легаси систем в аналитическом ландшафте Банка и завершить переезд в lakehouse платформу данных Data Ocean Nova. Будем идти с опрежением или отставанием - покажет время.

  • Андрей Лобода
    Рейтинг: 82
    «Национальные лотереи»
    Руководитель проектов, Проектный офис
    26.12.2025 13:35

    Александр, добрый день!Если была бы возможность вернуться назад и что-то изменить в начале проекта что бы вы сделали?

    • Александр Заболоцкий Андрей
      Рейтинг: 94
      Альфа-Банк
      Руководитель дирекции технологических платформ и развития процессов управления данными
      26.12.2025 14:05

      Андрей, добрый день и спасибо за вопрос. На старте проекта мы допустили одну ошибку - не его начали раньше. Надо было начинать на полтра-два года раньше, но объективно оценивая, решений и экспертизы на рынке в тот момент еще не было поэтому и нам и вендору многое приходилось делать впервые, адапатируюсь по ходу.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.