Добавление postgre База данных SQL источника CDC в поток событий
В этой статье показано, как добавить источник Postgre База данных SQL Изменение записи данных (CDC) в поток событий.
Соединитель источника отслеживания измененных данных (CDC) Postgre База данных SQL для потоков событий Microsoft Fabric позволяет записывать моментальный снимок текущих данных в базе данных PostgreSQL. Затем соединитель отслеживает и записывает любые будущие изменения на уровне строк в эти данные. После записи изменений в потоке событий вы можете обрабатывать эти данные CDC в режиме реального времени и отправлять их в разные места назначения в Fabric для дальнейшей обработки или анализа.
Примечание.
Этот источник не поддерживается в следующих регионах емкости рабочей области: западная часть США 3, Западная Швейцария.
Необходимые компоненты
Доступ к рабочей области в режиме лицензии емкости Fabric (или) режим пробной лицензии с разрешениями участника или более высокого уровня.
Зарегистрированный доступ пользователей в базе данных PostgreSQL.
База данных PostgreSQL должна быть общедоступной, а не за брандмауэром или защищенной в виртуальной сети.
CDC включен в базе данных и таблицах PostgreSQL.
Если у вас есть База данных Azure для PostgreSQL, выполните действия, описанные в следующем разделе, чтобы включить CDC. Подробные сведения см. в разделе "Логическая репликация и логическое декодирование" — База данных Azure для PostgreSQL — гибкий сервер.
Дополнительные сведения о других базах данных PostgreSQL см. в документации по Debezium connector for PostgreSQL :: Debezium.
Если у вас нет потока событий, создайте поток событий.
Включение CDC в База данных Azure для PostgreSQL
Чтобы включить CDC в База данных Azure для PostgreSQL гибкий сервер, выполните следующие действия.
На странице База данных Azure для PostgreSQL гибкого сервера в портал Azure выберите параметры сервера в меню навигации.
На странице параметров сервера:
- Задайте для wal_level логический параметр.
- Обновите max_worker_processes до не менее 16.
Сохраните изменения и перезапустите сервер.
Убедитесь, что экземпляр гибкого сервера База данных Azure для PostgreSQL разрешает общедоступный сетевой трафик.
Предоставьте администраторам разрешения на репликацию, выполнив следующую инструкцию SQL. Если вы хотите использовать другую учетную запись пользователя для подключения базы данных PostgreSQL для получения CDC, убедитесь, что пользователь является владельцем таблицы.
ALTER ROLE <admin_user_or_table_owner_user> WITH REPLICATION;
Запуск мастера выбора источника данных
Если вы еще не добавили источник в поток событий, выберите "Использовать внешнюю плитку источника ".
Если вы добавляете источник в уже опубликованный поток событий, перейдите в режим редактирования, выберите "Добавить источник" на ленте и выберите "Внешние источники".
На странице "Выбор источника данных" найдите и выберите "Подключиться" на плитке Azure DB для PostgreSQL (CDC).
Настройка и подключение к База данных Azure для PostgreSQL CDC
На странице "Подключение" выберите "Создать подключение".
В разделе "Параметры подключения" введите следующие сведения.
Сервер: адрес сервера базы данных PostgreSQL, например my-pgsql-server.postgres.database.azure.com.
База данных: имя базы данных, например my_database.
Прокрутите вниз и в разделе учетных данных подключения выполните следующие действия.
В поле "Имя подключения" введите имя подключения.
Для типа проверки подлинности выберите "Базовый".
Примечание.
В настоящее время потоки событий Fabric поддерживают только обычную проверку подлинности.
Введите имя пользователя и пароль для базы данных.
Нажмите Подключиться.
Теперь на странице "Подключение" выполните следующие действия:
На странице "Просмотр и подключение" просмотрите сводку и нажмите кнопку "Добавить".
Примечание.
Максимальное количество источников и назначений для одного потока событий — 11.
Просмотр обновленного потока событий
Вы можете увидеть источник Postgre База данных SQL CDC, добавленный в поток событий в режиме редактирования.
Чтобы реализовать новый добавленный источник CDC базы данных PostgreSQL, выберите "Опубликовать". После выполнения этих действий источник CDC базы данных PostgreSQL доступен для визуализации в режиме реального времени.
Связанный контент
Другие соединители:
- Потоки данных Amazon Kinesis
- Azure Cosmos DB
- Центры событий Azure
- Служебная шина Azure
- Центр Интернета вещей Azure
- База данных SQL Azure отслеживания измененных данных (CDC)
- Confluent Kafka
- Пользовательская конечная точка
- Google Cloud Pub/Sub
- My База данных SQL CDC
- Postgre База данных SQL CDC
- Пример данных
- события Хранилище BLOB-объектов Azure
- Событие рабочей области Fabric