Датафлот Репликация:
современный подход
к наполнению Data Lakehouse с Apache Iceberg
Датафлот Репликация поддерживает (начиная с версии 2026.1) доставку данных в Apache Iceberg — открытый табличный формат, используемый в Data Lakehouse и в озёрах данных.

Теперь вы можете использовать Датафлот Репликацию не только для миграции и онлайн‑репликации между СУБД, но и для построения аналитических систем нового поколения.

Почему это важно для вас?

  • Сокращение времени вывода данных в аналитику – с дней и часов до минут.
  • Снижение затрат на разработку и сопровождение множества ETL-конвейеров, а также на хранение промежуточных копий.
  • Гибкость – бизнес-пользователи могут исследовать новые источники данных без привлечения инженеров данных.
  • Единая архитектурная среда для озёр, Data Lakehouse и интеграционных механизмов.
Реализуйте сценарии Zero‑ETL и EL‑конвейеров
Классический ETL (Extract, Transform, Load) требует трудоёмкой предварительной подготовки данных. Zero‑ETL – это подход, применяемый для Data Lakehouse, во многом благодаря Iceberg.

Датафлот Репликация помогает воплотить Zero‑ETL в вашей инфраструктуре через потоковую интеграцию: от непосредственного получения данных через Change Data Capture (CDC) с автоматическим созданием «живых» материализованных представлений, обновляемых за секунды.

EL‑конвейеры (Extract‑Load): один шаг к упрощению. Вы загружаете сырые данные, а трансформация переносится на сторону потребителя или выполняется позже внутри Lakehouse. Это убирает тяжёлый этап предварительного проектирования ETL‑схем.

Результат: с помощью Датафлот Репликации за 10 минут можно настроить конвейер данных для наполнения Data Lakehouse или озера данных.
Получите брошюру по наполнению Iceberg
Задачи, которые решает Датафлот Репликация
Миграция с Greenplum в открытые форматы данных
– Начальная миграция

– Автоматическое переключение
на перенос изменений

– Контроль и перенос изменений (CDC)
Быстрое и дешевое построение конвейеров данных
– Построение EL-конвейеров аналитиками без необходимость привлечения Data Ops

– Без разработки и промежуточных доставок данных
Гарантия доставки
– Поддержка транзакций

– Гарантированная доставка данных в получатель
Минимальная задержка или нагрузка
– Репликация в режиме, близком

к реальному времени

– Возможность доставки изменений
по расписанию в ночные окна
Интеграция
с системами
– Одновременная репликация в другие БД, хранилища, стриминговые
и ETL-платформы

– Поддержка событийно-ориентированных архитектур
Наполнение Data Lakehouse и озёр данных
– Доставка изменений в открытые форматы данных и файлов (Parquet, Iceberg, CSV, JSON)

– Начальный (полный) перенос данных

Низкая нагрузка на источники
– Собственные парсеры логов

– Возможность работы на основании скопированных логов, даже без доступа к СУБД

КАКИЕ БИЗНЕС-ЗАДАЧИ РЕШАЮТСЯ
Благодаря быстрой доставке свежих данных через Датафлот Репликацию в Lakehouse на базе Iceberg вы можете реализовать
Узнайте больше о решении Датафлот Репликация и о том, как оно помогает строить современные Data Lakehouse на базе Apache Iceberg.
Готовы попробовать?
Индивидуальные предложения для клиентов
Конвейеры расчётов
Риск‑менеджмент и трейдинг
Динамическое ценообразование
Оперативный мониторинг оборудования и предиктивное обслуживание
Кибербезопасность (SIEM/SOAR)
Обнаружение мошенничества
Запросить демо
Apache Iceberg - фундамент современного Data Lakehouse
Что вы получаете с Iceberg
ACID‑транзакции и изоляция
Эволюция схемы без перезаписи данных
Эффективные UPDATE/DELETE
Time Travel
никаких «рваных» чтений во время записи
вы можете добавлять, переименовывать, удалять колонки
точечные изменения больше не требуют перезаписи целых партиций
возможность «откатиться» к любому состоянию таблицы
Скрытое партиционирование
Стандартизация через REST Catalog
Ветвление (branching) и теги
Merge-on-Read
Iceberg сам управляет физической раскладкой по логическому правилу
любой инструмент, который поддерживает Iceberg, работает с каталогом без дополнительных коннекторов
дает возможность экспериментировать
с данными в изолированных ветках, как в Git
обновления записываются как отдельные файлы удалений/вставок
Iceberg — это не просто формат файлов, а полноценный табличный формат с ACID‑транзакциями,
контролем версий и эволюцией схемы. Он надстраивается поверх Parquet, ORC или Avro, добавляя критически важные возможности, которых нет у простого набора файлов.

Датафлот Репликация позволяет наполнять оба формата: Parquet и Iceberg
Хотите узнать больше?
Оставьте заявку и мы расскажем, как внедрить Датафлот Репликацию в вашем проекте
Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь c политикой конфиденциальности