Руководство по анализу тональности с помощью служб ИИ Azure
В этом руководстве описано, как дополнить данные в Azure Synapse Analytics с помощью служб ИИ Azure. Вы будете использовать возможности анализа текста языка ИИ Azure для анализа тональности.
Пользователь в Azure Synapse может выбрать таблицу, содержащую текстовый столбец для обогащения тональности. Эти тональности могут быть положительными, отрицательными, смешанными или нейтральными. С ними также возвращаются данные о вероятности.
Темы, рассматриваемые в этом руководстве:
- получение набора данных из таблицы Spark, содержащей текстовый столбец, для анализа тональности;
- Использование мастера в Azure Synapse для обогащения данных с помощью Анализ текста на языке искусственного интеллекта Azure.
Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.
Необходимые компоненты
- Рабочая область Azure Synapse Analytics с учетной записью хранения Azure Data Lake Storage 2-го поколения, настроенной в качестве хранилища по умолчанию. При работе с файловой системой Data Lake Storage 2-го поколения требуются права участника данных Хранилища BLOB-объектов.
- Пул Spark в рабочей области Azure Synapse Analytics. Дополнительные сведения см. в статье Создание пула Spark в Azure Synapse.
- Действия по предварительной настройке, описанные в руководстве. Настройка служб ИИ Azure в Azure Synapse.
Войдите на портал Azure
Войдите на портал Azure.
Создание таблицы Spark
Для работы с этим руководством вам потребуется таблица Spark.
Скачайте файл FabrikamComments.csv, который содержит набор данных для анализа текста.
В Synapse analytics откройте учетную запись хранения в разделе "Данные" и "Связанные".
Отправьте этот файл в учетную запись хранения Azure Synapse в Data Lake Storage 2-го поколения.
Создайте таблицу Spark из CSV-файла. Для этого щелкните этот файл правой кнопкой мыши и последовательно выберите элементы Создать записную книжку>Создать таблицу Spark.
Задайте и назовите
header=True
таблицу в ячейке кода. Затем запустите записную книжку в пуле Spark.%%pyspark df = spark.read.load('abfss://default@azuresynapsesa.dfs.core.windows.net/data/FabrikamComments.csv', format='csv' ## If a header exists, uncomment the line below , header=True ) df.write.mode("overwrite").saveAsTable("default.YourTableName")
Откройте мастер служб ИИ Azure
На вкладке "Рабочая область" на странице данных в таблице озера по умолчанию щелкните правой кнопкой мыши таблицу Spark, созданную в предыдущей процедуре.
Чтобы открыть мастер, выберите Машинное обучение>Predict with a model (Спрогнозировать с помощью модели).
Появится панель конфигурации, и вам будет предложено выбрать предварительно обученную модель. Выберите Анализ тональности.
Настройка анализа тональности
Затем настройте анализ тональности. Выберите следующие данные:
- Связанная служба Azure Cognitive Services. В рамках необходимых действий вы создали связанную службу в службе ИИ Azure. Выберите ее.
- Язык: выберите английский язык в качестве языка текста, на который требуется выполнить анализ тональности.
- Текстовый столбец: выберите комментарий (строку) в качестве текстового столбца в наборе данных, который необходимо проанализировать, чтобы определить тональность.
Когда все будет готово, выберите Открыть записную книжку. Это создает записную книжку для вас с кодом PySpark, который выполняет анализ тональности со службами ИИ Azure.
Запустите записную книжку
Только что открываемая записная книжка использует библиотеку SynapseML для подключения к службам ИИ Azure. Связанная служба ИИ Azure позволяет безопасно ссылаться на службу ИИ Azure из этого интерфейса, не раскрывая секреты.
Теперь вы можете выполнить все ячейки, чтобы дополнить данные сведениями о тональности. Выберите элемент Запустить все.
Тональности возвращаются как положительные, отрицательные, нейтральные или смешанные. Вы также получите данные о вероятности для каждой тональности. Дополнительные сведения об анализе тональности в службах ИИ Azure.