Поделиться через


Обзор обогащение неструктурированных клинических заметок (предварительная версия) в решениях для данных здравоохранения

Важно

  • Это предварительная версия функции.
  • Предварительные версии функций не предназначены для использования в производственной среде, а их функциональность может быть ограничена. Они доступны перед официальным выпуском, чтобы клиенты могли досрочно получить доступ и предоставить отзывы.
  • Условия предоставления услуг см. в разделе Решения для данных здравоохранения в Microsoft Fabric.

Обогащение неструктурированных клинических заметок (предварительная версия) — это возможность, которая использует службу языка ИИ Azure Text Analytics for Health для извлечения и структурирования данных, повышая их аналитический потенциал. Эта служба извлекает ключевые сущности ресурсов быстрого взаимодействия в сфере здравоохранения (FHIR) из неструктурированных клинических заметок и создает структурированные данные из этих клинических заметок. Затем вы можете проанализировать эти структурированные данные, чтобы получить аналитические сведения, прогнозы и показатели качества, направленные на улучшение результатов лечения пациентов.

Text Analytics for Health позволяет маркировать информацию с помощью распознавания именованных сущностей (NER) и связывания сущностей. Эту службу можно использовать в качестве модульного компонента в конвейерах данных решений для данных здравоохранения для создания структурированных данных FHIR из неструктурированных клинических заметок. Данные FHIR могут содержать ссылки на документы или части документов, известные как DocumentReferences. Эти документы часто содержат обширную клиническую информацию, которая может улучшить клинический профиль пациента при преобразовании в структурированные медицинские данные, соответствующие стандарту FHIR. Клинические заметки также являются отличным источником информации, которую можно использовать для определения плана ведения пациента и достижения лучших результатов. Аналитики и специалисты по обработке и анализу данных могут использовать эти данные для исследовательского анализа своих наборов клинических данных.

Обогащение неструктурированных клинических заметок (предварительная версия) является дополнительной возможностью в решениях для данных здравоохранения Microsoft Fabric. Вы можете решить, использовать его или нет, в зависимости от ваших конкретных потребностей или сценариев.

Сведения о развертывании, настройке и использовании этой возможности см. в разделе:

Заметка

Обогащение неструктурированных клинических заметок (предварительная версия) не поддерживает интеграцию с другими службами обработки естественного языка, кроме Text Analytics for Health службы языка ИИ Azure.

Предварительные условия

Использование службы Text Analytics for Health службы языка ИИ Azure не является обязательным. Но если вы используете ее, вы должны принять условия и положения ответственного применения ИИ для развертывания службы в вашей среде. Инструкции по установке см. в разделе Настройка языковой службы Azure.

Чтобы просмотреть информационная статья, см.:

Модель ценообразования

Модель ценообразования основана на общем количестве текстовых записей, обработанных службой API Text Analytics for Health. Текстовая запись измеряется как 1000 символов. Это означает, что для каждого фрагмента текста, который вы отправляете в API для анализа, количество символов текста делится на 1000, чтобы определить количество используемых текстовых записей. Например, если вы отправляете текст длиной 3200 символов, он считается четырьмя текстовыми записями. Служба использует эту модель расчета для выставления счетов.

Ниже приведена детализация затрат на обработку документов:

  • Для 5000 текстовых записей в службу включен логический вывод.
  • Для 5000–500000 текстовых записей стоимость составляет 25 долларов США (USD) за 1000 обработанных текстовых записей.
  • Для 500000–2500000 текстовых записей стоимость составляет 15 долларов США (USD) за 1000 обработанных текстовых записей.
  • Для более чем 2500000 текстовых записей стоимость составляет 10 долларов США (USD) за 1000 обработанных текстовых записей.

Модель ценообразования поощряет обработку больших объемов текста, предлагая сниженную стоимость одной записи для больших объемов. Тарифицируются только успешные выводы.

Чтобы избежать затрат на обработку, мы ограничиваем объем обрабатываемого API текста documentreferencecontent (клинических заметок), устанавливая значение параметра nlp_document_limit на 10 в записной книжке healthcare#_msft_ta4h_silver_ingestion. Дополнительные сведения о модели ценообразования см. в разделе Ценообразование службы языка ИИ Azure.