Поделиться через


Руководство по анализу тональности с помощью служб ИИ Azure

В этом руководстве описано, как дополнить данные в Azure Synapse Analytics с помощью служб ИИ Azure. Вы будете использовать возможности анализа текста языка ИИ Azure для анализа тональности.

Пользователь в Azure Synapse может выбрать таблицу, содержащую текстовый столбец для обогащения тональности. Эти тональности могут быть положительными, отрицательными, смешанными или нейтральными. С ними также возвращаются данные о вероятности.

Темы, рассматриваемые в этом руководстве:

  • получение набора данных из таблицы Spark, содержащей текстовый столбец, для анализа тональности;
  • Использование мастера в Azure Synapse для обогащения данных с помощью Анализ текста на языке искусственного интеллекта Azure.

Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.

Необходимые компоненты

  • Рабочая область Azure Synapse Analytics с учетной записью хранения Azure Data Lake Storage 2-го поколения, настроенной в качестве хранилища по умолчанию. При работе с файловой системой Data Lake Storage 2-го поколения требуются права участника данных Хранилища BLOB-объектов.
  • Пул Spark в рабочей области Azure Synapse Analytics. Дополнительные сведения см. в статье Создание пула Spark в Azure Synapse.
  • Действия по предварительной настройке, описанные в руководстве. Настройка служб ИИ Azure в Azure Synapse.

Войдите на портал Azure

Войдите на портал Azure.

Создание таблицы Spark

Для работы с этим руководством вам потребуется таблица Spark.

  1. Скачайте файл FabrikamComments.csv, который содержит набор данных для анализа текста.

  2. В Synapse analytics откройте учетную запись хранения в разделе "Данные" и "Связанные".

  3. Отправьте этот файл в учетную запись хранения Azure Synapse в Data Lake Storage 2-го поколения.

    Снимок экрана: варианты для отправки данных.

  4. Создайте таблицу Spark из CSV-файла. Для этого щелкните этот файл правой кнопкой мыши и последовательно выберите элементы Создать записную книжку>Создать таблицу Spark.

    Снимок экрана: варианты для создания таблицы Spark.

  5. Задайте и назовите header=True таблицу в ячейке кода. Затем запустите записную книжку в пуле Spark.

    Снимок экрана: выполнение записной книжки.

    %%pyspark
    df = spark.read.load('abfss://default@azuresynapsesa.dfs.core.windows.net/data/FabrikamComments.csv', format='csv'
    ## If a header exists, uncomment the line below
    , header=True
    )
    df.write.mode("overwrite").saveAsTable("default.YourTableName")
    

Откройте мастер служб ИИ Azure

  1. На вкладке "Рабочая область" на странице данных в таблице озера по умолчанию щелкните правой кнопкой мыши таблицу Spark, созданную в предыдущей процедуре.

  2. Чтобы открыть мастер, выберите Машинное обучение>Predict with a model (Спрогнозировать с помощью модели).

    Снимок экрана: варианты для открытия мастера оценки.

  3. Появится панель конфигурации, и вам будет предложено выбрать предварительно обученную модель. Выберите Анализ тональности.

    Снимок экрана: выбор предварительно обученной модели анализа тональности.

Настройка анализа тональности

Затем настройте анализ тональности. Выберите следующие данные:

  • Связанная служба Azure Cognitive Services. В рамках необходимых действий вы создали связанную службу в службе ИИ Azure. Выберите ее.
  • Язык: выберите английский язык в качестве языка текста, на который требуется выполнить анализ тональности.
  • Текстовый столбец: выберите комментарий (строку) в качестве текстового столбца в наборе данных, который необходимо проанализировать, чтобы определить тональность.

Когда все будет готово, выберите Открыть записную книжку. Это создает записную книжку для вас с кодом PySpark, который выполняет анализ тональности со службами ИИ Azure.

Снимок экрана: параметры для настройки анализа тональности.

Запустите записную книжку

Только что открываемая записная книжка использует библиотеку SynapseML для подключения к службам ИИ Azure. Связанная служба ИИ Azure позволяет безопасно ссылаться на службу ИИ Azure из этого интерфейса, не раскрывая секреты.

Теперь вы можете выполнить все ячейки, чтобы дополнить данные сведениями о тональности. Выберите элемент Запустить все.

Тональности возвращаются как положительные, отрицательные, нейтральные или смешанные. Вы также получите данные о вероятности для каждой тональности. Дополнительные сведения об анализе тональности в службах ИИ Azure.

Снимок экрана: анализ тональности.