Поделиться через


Знакомство с главным пулом в SQL Server Кластеры больших данных

Область применения: SQL Server 2019 (15.x)

Внимание

Поддержка надстройки "Кластеры больших данных" Microsoft SQL Server 2019 будет прекращена. Мы прекратим поддержку Кластеров больших данных SQL Server 2019 28 февраля 2025 г. Все существующие пользователи SQL Server 2019 с Software Assurance будут полностью поддерживаться на платформе, и программное обеспечение будет продолжать поддерживаться с помощью накопительных обновлений SQL Server до этого времени. Дополнительные сведения см. в записи блога объявлений и в статье о параметрах больших данных на платформе Microsoft SQL Server.

Эта статья описывает роль главного экземпляра SQL Server в кластере больших данных SQL Server. Главный пул содержит главный экземпляр SQL Server. Главный экземпляр — это экземпляр SQL Server, работающий в кластере больших данных SQL Server, который контролирует подключения, запросы на масштабирование, метаданные, пользовательские базы данных и службы машинного обучения.

Главный экземпляр SQL Server предоставляет следующие функциональные возможности.

Подключение

Главный экземпляр SQL Server предоставляет доступную извне конечную точку TDS для кластера. Вы можете подключать приложения или средства SQL Server, такие как Azure Data Studio или SQL Server Management Studio, к этой конечной точке, как и в случае с любым другим экземпляром SQL Server.

Управление запросами масштабирования

Главный экземпляр SQL Server содержит подсистему запросов масштабирования, которая используется для распределения запросов по экземплярам SQL Server на узлах в пуле вычислений. Подсистема запросов масштабирования также предоставляет доступ через Transact-SQL ко всем таблицам Hive в кластере без дополнительной настройки.

Метаданные и пользовательские базы данных

Помимо стандартных системных баз данных SQL Server, в главном экземпляре SQL Server также содержится следующее:

  • База данных метаданных, содержащая метаданные таблицы HDFS.
  • Карта сегментов плоскости данных.
  • Сведения о внешних таблицах, предоставляющих доступ к плоскости данных кластера.
  • Внешние источники данных и внешние таблицы PolyBase, определенные в пользовательских базах данных.

Вы также можете добавить собственные пользовательские базы данных в главный экземпляр SQL Server.

Службы машинного обучения

Службы машинного обучения SQL Server являются дополнительным компонентом для ядра СУБД. Они используются для выполнения кода Java, R и Python в SQL Server. Эта функция основана на платформе расширяемости SQL Server, которая изолирует внешние процессы от процессов ядра, но полностью интегрируется с реляционными данными в виде хранимых процедур, скрипта T-SQL, содержащего инструкции R или Python, или кода Java, R или Python, содержащего T-SQL.

В рамках кластера больших данных SQL Server службы машинного обучения будут доступны в главном экземпляре SQL Server по умолчанию. Вы можете включить для главного экземпляра возможность выполнения внешних скриптов, чтобы запускать скрипты на Java, R и Python с использованием sp_execute_external_script.

Преимущества служб машинного обучения в кластере больших данных

SQL Server Кластеры больших данных упрощает присоединение больших данных к размерным данным, которые обычно хранятся в корпоративной базе данных. Ценность больших данных значительно возрастает, если они не просто доступны части сотрудников организации, а находят отражение в отчетах, приложениях и на панелях мониторинга. В то же время специалисты по обработке и анализу данных могут и дальше использовать средства экосистемы Spark/HDFS, чтобы легко обращаться в реальном времени к данным главного экземпляра SQL Server и ко внешним источникам данных, которые доступны через главный экземпляр.

С помощью sql Server Кластеры больших данных вы можете сделать больше с корпоративными озерами данных. Аналитики и разработчики SQL Server могут:

  • создавать приложения, используя данные из корпоративных озер данных;
  • обозревать все данные с помощью запросов Transact-SQL;
  • использовать существующую экосистему средств и приложений SQL Server для доступа к корпоративным данным и их анализа;
  • сокращать потребность в перемещении данных за счет виртуализации и киосков данных;
  • продолжить использовать Spark для сценариев с большими данными;
  • создавать интеллектуальные корпоративные приложения с помощью Spark или SQL Server для обучения моделей по озерам данных;
  • использовать модели в рабочих базах данных для повышения производительности;
  • осуществлять потоковую передачу данных напрямую в корпоративные киоски данных для аналитики в режиме реального времени;
  • визуально изучать данные с помощью интерактивного анализа и средств бизнес-аналитики.

Следующие шаги

Дополнительные сведения о Кластеры больших данных SQL Server см. в следующих ресурсах: