Поделиться через


Начало работы с Azure Synapse Link для Базы данных SQL Azure

В этой статье описано пошаговое руководство по началу работы с Azure Synapse Link для База данных SQL Azure. Общие сведения об этой функции см. в статье Azure Synapse Link для База данных SQL Azure.

Предварительные условия

  • Чтобы получить Azure Synapse Link для SQL, см. статью "Создание новой рабочей области Azure Synapse". В этом руководстве описано, как создать Azure Synapse Link для SQL в общедоступной сети. В этой статье предполагается, что вы выбрали отключить управляемую виртуальную сеть и разрешить подключения со всех IP-адресов при создании рабочей области Azure Synapse. Если вы хотите настроить Azure Synapse Link для База данных SQL Azure с сетевой безопасностью, см. также статью "Настройка Azure Synapse Link для База данных SQL Azure с сетевой безопасностью".

  • Для обеспечения на основе единицы транзакций базы данных (DTU) убедитесь, что служба базы данных Azure SQL находится на уровне не ниже, чем "Стандартный", с минимумом 100 DTU. Бесплатные, базовые или стандартные уровни с количеством DTU менее чем 100 не поддерживаются.

Настройка исходной базы данных SQL Azure

  1. Войдите на портал Azure.

  2. Перейдите на логический сервер Azure SQL, выберите Удостоверение, и затем установите Управляемое удостоверение, назначенное системой в положение Вкл.

    Снимок экрана включения управляемой системой назначенной учетной записи.

  3. Перейдите в сеть, а затем установите флажок "Разрешить службам и ресурсам Azure" доступ к этому серверу .

    Снимок экрана: настройка брандмауэров для базы данных SQL с помощью портал Azure.

  4. С помощью Microsoft SQL Server Management Studio (SSMS) или Azure Data Studio подключитесь к логическому серверу. Если вы хотите подключить рабочую область Azure Synapse к базе данных SQL Azure с помощью управляемого удостоверения, задайте разрешения администратора Microsoft Entra на логическом сервере. Чтобы применить привилегии на шаге 6, используйте то же имя администратора, чтобы подключиться к логическому серверу с правами администратора.

  5. Разверните базы данных, щелкните правой кнопкой мыши созданную базу данных и выберите команду "Создать запрос".

    Снимок экрана: выбор базы данных и создание нового запроса.

  6. Если вы хотите подключить рабочую область Azure Synapse к исходной базе данных SQL Azure с помощью управляемого удостоверения, выполните следующий сценарий, чтобы предоставить управляемому удостоверению разрешение на доступ к исходной базе данных.

    Этот шаг можно пропустить, если вы хотите подключить рабочую область Azure Synapse к исходной базе данных SQL Azure с помощью проверки подлинности SQL.

    CREATE USER <workspace name> FROM EXTERNAL PROVIDER;
    ALTER ROLE [db_owner] ADD MEMBER <workspace name>;
    
  7. Вы можете создать таблицу с собственной схемой. Следующий код — это просто пример CREATE TABLE запроса. Вы также можете вставить в эту таблицу некоторые строки, чтобы обеспечить репликацию данных.

    CREATE TABLE myTestTable1 (c1 int primary key, c2 int, c3 nvarchar(50)) 
    

Создание целевого пула SQL Azure Synapse

  1. Откройте Synapse Studio.

  2. Перейдите в центр управления , выберите пулы SQL и нажмите кнопку "Создать".

    Снимок экрана: создание выделенного пула SQL из Synapse Studio.

  3. Введите уникальное имя пула, используйте параметры по умолчанию и создайте выделенный пул.

  4. Необходимо создать схему, если ожидаемая схема недоступна в целевой базе данных SQL Azure Synapse. Если ваша схема - владелец базы данных (dbo), вы можете пропустить этот шаг.

  1. В левой области портал Azure выберите "Интеграция".

  2. На панели "Интеграция" выберите знак плюса (+), а затем выберите "Связать подключение".

    Снимок экрана, на котором показано, как выбрать новое подключение по ссылке из Synapse Studio.

  3. В разделе Source linked service (Связанная исходная служба) выберите команду Создать.

    Снимок экрана: выбор новой связанной службы.

  4. Введите сведения для исходной базы данных SQL Azure.

    • Выберите подписку, сервер и базу данных, соответствующую базе данных SQL Azure.
    • Выполните одно из следующих действий:
      • Чтобы подключить рабочую область Azure Synapse к исходной базе данных, используя управляемое удостоверение рабочей области, установите тип проверки подлинности на Управляемое удостоверение.
      • Чтобы использовать SQL проверку подлинности, если у вас есть имя пользователя и пароль, выберите SQL проверка подлинности.

    Снимок экрана: ввод сведений о сервере и базе данных для создания связанной службы.

    Примечание.

    Поддерживается только связанная служба в устаревшей версии.

  5. Выберите проверить подключение , чтобы убедиться, что правила брандмауэра настроены правильно, а рабочая область может успешно подключиться к исходной базе данных SQL Azure.

  6. Нажмите кнопку создания.

    Примечание.

    Связанная служба, созданная здесь, не предназначена для Azure Synapse Link для SQL. Его можно использовать любым пользователем рабочей области, у которого есть соответствующие разрешения. Получите время, чтобы понять область действия пользователей, которые могут иметь доступ к этой связанной службе и ее учетным данным. Дополнительные сведения о разрешениях в рабочих областях Azure Synapse см. в обзоре управления доступом к рабочей области Azure Synapse — Azure Synapse Analytics.

  7. Выберите одну или несколько исходных таблиц для репликации в рабочую область Azure Synapse и нажмите кнопку "Продолжить".

    Примечание.

    Указанная исходная таблица может быть включена только в одном соединении со ссылкой одновременно.

  8. Выберите целевую базу данных и пул SQL Azure Synapse.

  9. Укажите имя для подключения Azure Synapse Link и выберите количество ядер для вычислительных ресурсов подключения. С помощью этих ядер данные будут перемещаться из источника в целевой объект.

    Примечание.

    • Количество ядер, которые вы выбираете здесь, выделяется службе приема для обработки загрузки и изменения данных. Они не влияют на конфигурацию исходной базы данных Azure SQL или конфигурацию целевого выделенного пула SQL.
    • Мы рекомендуем сначала использовать минимальное количество ядер и увеличивать их число по мере необходимости.
  10. Нажмите ОК.

  11. При открытии нового подключения Azure Synapse Link можно обновить имя целевой таблицы, тип распространения и тип структуры.

    Примечание.

    • Рекомендуется использовать таблицу кучи для типа структуры, если данные содержат varchar(max), nvarchar(max), и varbinary(max).
    • Убедитесь, что схема в выделенном пуле Azure Synapse SQL уже создана перед началом подключения к ссылке. Azure Synapse Link для SQL автоматически создает таблицы под схемой в выделенном пуле SQL Azure Synapse.

    Снимок экрана: место изменения подключения Azure Synapse Link из Synapse Studio.

  12. В раскрывающемся списке "Действие для существующей целевой таблицы" выберите вариант, наиболее подходящий для вашего сценария, если таблица уже существует в назначении.

    • Удаление и повторное создание таблицы: существующая целевая таблица будет удалена и воссоздана.
    • Сбой при непустой таблице: если целевая таблица содержит данные, создание связи для данной таблицы завершится ошибкой.
    • Слияние с существующими данными: данные будут объединены в существующую таблицу.

    Примечание.

    Если вы хотите объединить несколько источников в одно место назначения, выбрав "Объединить с существующими данными", убедитесь, что источники содержат разные данные, чтобы избежать конфликтов и непредвиденных результатов.

  13. Укажите, следует ли включить согласованность транзакций в таблицах.

    • Если этот параметр включен, транзакция по нескольким таблицам в исходной базе данных всегда реплицируется в целевую базу данных в одной транзакции. Но это приведет к повышению затрат на общую пропускную способность репликации.
    • Если эта опция отключена, каждая таблица будет реплицировать изменения к месту назначения в рамках своей собственной транзакции, используя параллельные подключения, что повышает общую пропускную способность репликации.

    Примечание.

    Если вы хотите включить согласованность транзакций между таблицами, убедитесь, что в выделенном пуле Synapse SQL установлены уровни изоляции транзакций как READ COMMITTED SNAPSHOT ISOLATION.

  14. Выберите Опубликовать все, чтобы сохранить новое подключение к службе.

Нажмите кнопку "Пуск", а затем подождите несколько минут, пока данные будут реплицированы.

Примечание.

Связь через ссылку начинается с полной начальной загрузки из исходной базы данных, а затем пошаговых изменений с использованием функции потока изменений в базе данных Azure SQL. Дополнительные сведения см. в статье Канал изменений Azure Synapse Link для SQL.

Вы можете отслеживать состояние подключения Azure Synapse Link, просмотреть, какие таблицы изначально копируются (моментальные снимки) и увидеть, какие таблицы находятся в режиме непрерывной репликации (репликация).

  1. Перейдите в центр "Монитор" , затем выберите элемент "Связать подключения" .

    Снимок экрана, на котором показано, как отслеживать состояние подключения Azure Synapse Link из концентратора монитора.

  2. Откройте запущенное подключение Azure Synapse Link и просмотрите состояние каждой таблицы.

  3. Выберите команду Обновить в представлении мониторинга для подключения, чтобы отслеживать обновления состояния.

Запрос реплицированных данных

Подождите несколько минут, а затем убедитесь, что целевая база данных имеет ожидаемую таблицу и данные. Теперь вы можете изучить реплицированные таблицы в целевом выделенном пуле SQL Azure Synapse.

  1. В центре данных в разделе "Рабочая область" откройте целевую базу данных.

  2. В разделе "Таблицы" щелкните правой кнопкой мыши одну из целевых таблиц.

  3. Выберите новый скрипт SQL и выберите верхние 100 строк.

  4. Выполните этот запрос, чтобы просмотреть реплицированные данные в целевом пуле Azure Synapse SQL.

  5. Вы также можете запросить целевую базу данных с помощью SSMS или других средств. Используйте выделенную конечную точку SQL для рабочей области в качестве имени сервера. Обычно это имя <workspacename>.sql.azuresynapse.net. Добавьте Database=databasename@poolname в качестве дополнительного параметра строки подключения при подключении через SSMS или другие инструменты.

Чтобы добавить или удалить таблицы в Synapse Studio, сделайте следующее:

  1. Откройте центр интеграции.

  2. Выберите соединение со ссылкой, которое нужно изменить, а затем откройте его.

  3. Выполните одно из приведенных ниже действий.

    • Чтобы добавить таблицу, выберите "Создать таблицу".
    • Чтобы удалить таблицу, щелкните значок корзины рядом с ним.

    Снимок экрана: панель подключения ссылки для добавления или удаления таблиц.

    Примечание.

    Вы можете непосредственно добавлять или удалять таблицы при активном подключении.

Чтобы остановить подключение Azure Synapse Link в Synapse Studio, сделайте следующее:

  1. В рабочей области Azure Synapse откройте центр интеграции .

  2. Выберите соединение со ссылкой, которое нужно изменить, а затем откройте его.

  3. Нажмите кнопку Остановить, чтобы остановить подключение по каналу. Репликация данных будет прекращена.

    Снимок экрана: панель для остановки соединения по ссылке.

    Примечание.

    • Если перезапустить соединение после его остановки, оно начнется с полной начальной загрузки из исходной базы данных, и затем последуют инкрементные потоки изменений.
    • Если вы выберете "Объединить с существующими данными" в качестве действия в существующей целевой таблице, при остановке подключения к ссылке и перезапуске ее удаление записей в источнике в течение этого периода не будет удалено в назначении. В таком случае, чтобы обеспечить согласованность данных, рекомендуется использовать приостановку и возобновление вместо остановки и запуска или очистку целевых таблиц перед перезапуском соединения связи.