Azure Synapse Link для SQL, вопросы и ответы

В этом руководстве приведены наиболее часто задаваемые вопросы о Azure Synapse Link для SQL.

Нет, в настоящее время Azure Synapse Link для SQL поддерживает в качестве целевого хранилища данных только выделенный пул SQL Synapse.

Нет, в настоящее время Azure Synapse Link для SQL поддерживает только База данных SQL Azure и SQL Server (начиная с SQL Server 2022) в качестве источника.

Нужно ли останавливать подключение связи, если требуется добавить или удалить таблицы в списке реплицируемых?

Нет, вы можете добавлять или удалять таблицы при наличии активного подключения связи. Удаленные таблицы перестают реплицироваться автоматически. Недавно добавленные таблицы начинаются с начальной загрузки с полным моментальным снимком, а затем выполняют добавочную синхронизацию. Остальные таблицы в том же подключении связи не будут затронуты.

Мои целевые таблицы существуют в целевом выделенном пуле SQL, что приводит к сбою запуска подключения по ссылке. Что делать?

Перед запуском подключения связи необходимо удалить целевые таблицы. Это можно сделать вручную, удалив таблицы из выделенного пула SQL Synapse или в раскрывающемся списке существующей целевой таблицы , выберите параметр "Удалить и повторно создать таблицу на целевом объекте", чтобы автоматически удалять существующие таблицы в выделенном пуле SQL Synapse каждый раз при запуске.

Что происходит с активным подключением связи, если добавляются или удаляются столбцы таблицы в исходных хранилищах?

После добавления таблиц в соединение связи эти таблицы в базе данных-источнике не позволяют добавлять, удалять или изменять столбцы. Чтобы выполнить такие изменения схемы, придется временно удалить таблицу из подключения связи и снова добавить ее после изменения схемы.

Можно ли приостановить репликацию данных для подключения связи, а затем возобновить ее с места приостановки?

Да, вы можете.

Можно ли выбрать управляемую виртуальную сеть в рабочей области Synapse с управляемыми частными конечными точками Synapse, которые позволяют приватно подключаться к исходной базе данных?

Да, вы можете. Аналогично всем рабочим нагрузкам в Synapse. Azure Synapse Link для SQL в управляемой Azure Synapse виртуальной сети можно включить для репликации данных из SQL в Synapse безопасным образом. Вы можете защититься от кражи данных, разрешая исходящее подключение из управляемой виртуальной сети только к утвержденным целевым объектам с помощью управляемых частных конечных точек.

Как правильно выбирать количество ядер для репликации таблиц из исходного хранилища в выделенный пул SQL Synapse при создании подключения связи?

Число ядер указывает объем вычислительных ресурсов, необходимый для репликации данных из исходного хранилища в выделенный пул SQL Synapse. Оно зависит от характера рабочей нагрузки репликации в исходной базе данных, количества таблиц, частоты внесения изменений, размера строк и так далее. Мы рекомендуем начать с небольшого количества ядер и проверить задержку при использовании реальной рабочей нагрузки. Задержка репликации может отражаться на странице мониторинга для таблиц связи. Время последней обработки столбца данных позволяет быстро понять, с какой задержкой выполняется репликация.

Нужно ли включать согласованность транзакций между таблицами?

Если этот параметр включен, транзакция по нескольким таблицам в исходной базе данных всегда реплицируется в целевую базу данных в одной транзакции. Но это приведет к повышению затрат на общую пропускную способность репликации. Если параметр отключен, каждая таблица реплицирует изменения в собственной границе транзакции в место назначения в параллельных подключениях, что повышает общую пропускную способность репликации. Если требуется включить согласованность транзакций в таблицах, убедитесь, что уровни изоляции транзакций в выделенном пуле SQL Synapse — READ COMMITTED SNAPSHOT ISOLATION.

Как правильно выбрать тип структуры для целевой таблицы в выделенном пуле SQL Synapse?

Изучите статью Индексы в таблицах выделенного пула SQL в Azure Synapse Analytics | Документация Майкрософт для понимания всех трех вариантов типа структуры таблиц. Если выбран кластеризованный индекс columnstore, тип данных с максимальной длиной (например, VARCHAR(MAX)) не поддерживается.

Нужно ли очистить данные в целевой зоне?

№ Существует фоновый поток, который удаляет зафиксированные файлы примерно через 24 часа до непрерывной работы ссылки. После остановки ссылки удаляется вся папка целевой зоны.

Azure Synapse Link для SQL доступен в следующих регионах:

Область Регион
Азиатско-Тихоокеанский регион Восточная Азия
Юго-Восточная Азия
Австралия Восточная Австралия
Юго-Восточная часть Австралии
Azure для государственных организаций US Gov (Аризона)
US Gov (Техас)
US Gov (Вирджиния)
Бразилия Южная Бразилия
Canada Центральная Канада
Восточная Канада
Китай Восточный Китай 2
Восточный Китай 3
Северный Китай 2
Северный Китай 3
Европа Северная Европа
Западная Европа
Франция Центральная Франция
Южная Франция
Германия Центрально-Западная Германия
Индия Центральная Индия
Южная Индия
Япония Восточная Япония
Западная Япония
Корея Республика Корея, центральный регион
Норвегия Восточная Норвегия;
Катар Центральный Катар
Швеция Центральная Швеция
Швейцария Северная Швейцария
Западная Швейцария
ОАЭ Северная часть ОАЭ;
United Kingdom южная часть Соединенного Королевства
западная часть Соединенного Королевства
США Центральная часть США
Восточная часть США
восточная часть США 2
Центрально-северная часть США
Центрально-южная часть США
Центрально-западная часть США
Западная часть США
западная часть США 2
Западная часть США — 3

Где находится моя целевая зона?

Для База данных SQL Azure целевая зона полностью управляется и находится в том же регионе, что и целевая рабочая область Azure Synapse Analytics. Для SQL Server 2022 целевая зона управляется клиентом и может находиться там, где вы хотите.

Какой тип шифрования применяется к целевой зоне?

Для База данных SQL Azure целевая зона полностью управляется и шифруется с тем же ключом, что и целевая рабочая область Azure Synapse Analytics , управляемая платформой или управляемым клиентом. Для SQL Server 2022 целевая зона управляется клиентом и может быть зашифрована с помощью ключа, управляемого платформой, или ключа, управляемого клиентом.

Я обновил все записи в исходной таблице. Когда я выполнил запрос к выделенному пулу SQL, я увидел все мои данные. Я повторно выполнил запрос, и все данные были возвращены - с обновлениями. Почему это происходит?

Служба приема обрабатывает обновления в виде удаления, за которым следует вставка — все в одной транзакции. По умолчанию выделенные пулы SQL выполняются в режиме READ UNCOMMITTED, что позволяет просматривать изменения до фиксации транзакции. Чтобы убедиться, что эти изменения не отображаются в процессе, можно включить ИЗОЛЯЦИю МОМЕНТАЛЬНЫХ СНИМКОВ READ COMMITTED.

Будут ли новые таблицы, добавленные в базу данных-источнике, автоматически добавляются в подключение к моей ссылке?

№ Чтобы добавить новые таблицы, необходимо изменить подключение ссылки в среде Azure Synapse Analytics. Вы можете добавлять таблицы в запущенное подключение без остановки. Новые таблицы будут включены в репликацию при публикации изменений в подключении ссылки.

Какова задержка для данных, реплицируемых из База данных SQL Azure и SQL Server 2022 в выделенные пулы SQL Azure Synapse Analytics?

Соглашение об уровне обслуживания об уровне обслуживания не опубликовано. Если вы видите высокую задержку, можно настроить количество ядер, выделенных для подключения связи, размер целевого выделенного пула SQL или настроить согласованность транзакций для конфигурации записи в соответствии с рабочей нагрузкой.

Какой формат используется для данных целевой зоны? Можно ли использовать его для других целей?

Целевая зона — это временное хранилище данных, и мы не поддерживаем использование этих данных для любой цели, отличной от Azure Synapse Link для SQL.

Azure Synapse Link для SQL использует модель отправки, в которой исходная база данных записывает данные в целевую целевую зону SQL и перемещается в целевой выделенный пул SQL службой приема, которая может выполняться непрерывно (обеспечивая обработку данных почти в режиме реального времени) или в режиме расписания. Действие копирования использует модель извлечения, в которой данные запрашиваются из исходной базы данных и записываются в целевое расположение по расписанию.

Это ограничение предназначено только для данных на странице. Для данных вне страницы единственное, что подсчитывается по пределу 7500 байтов, — это указатель на 24-байтовые данные вне страницы.

Новый обработчик канала изменений был интегрирован в подсистему База данных SQL Azure и SQL Server 2022, чтобы включить эту функцию.

Если sas истек срок действия учетной записи хранения, управляемой пользователем для целевой зоны, используйте ALTER DATABASE SCOPED CREDENTIAL , чтобы обновить учетные данные базы данных для нового SAS.

Если рабочая область Azure Synapse удалена, База данных SQL Azure остановит репликацию данных из целевой зоны в Azure Synapse. Системная хранимая процедура sp_change_feed_drop_table_group будет вызываться автоматически, а учетная запись хранения для целевой зоны управляется и будет автоматически удалена. Если это не удается, может появиться ошибка 22739 из SynapseGatewayClient в sys.dm_change_feed_errors. Если это происходит, можно вручную удалить группу changefeed таблиц с sp_change_feed_drop_table_groupпомощью .

В SQL Server, так как учетная запись хранения целевой зоны управляется пользователем, данные будут по-прежнему публиковаться в целевой зоне. Чтобы отключить Azure Synapse Link, удалите соответствующие группы таблиц с sp_change_feed_drop_table_group и вручную удалите учетную запись хранения для целевой зоны.

В SQL Server учетная запись хранения целевой зоны управляется пользователем. Если учетная запись хранения целевой зоны больше не доступна, в sys.dm_change_feed_errors будут отображаться ошибки. Чтобы отключить Azure Synapse Link, необходимо удалить соответствующие группы таблиц с sp_change_feed_drop_table_group.