의료 데이터 솔루션에서 OMOP 변환 배포 및 구성
참고
이 콘텐츠는 현재 업데이트 중입니다.
OMOP 변환을 사용하면 Observational Medical Outcomes Partnership(OMOP) 개방형 커뮤니티 표준을 통해 표준화된 분석을 위한 데이터 준비를 할 수 있습니다. 의료 데이터 솔루션 및 의료 데이터 기반 기능을 Fabric 작업 영역에 배치한 후에 이 기능을 사용할 수 있습니다.
OMOP 변환은 Microsoft Fabric의 의료 데이터 솔루션에서 선택적 기능입니다. 특정 요구 사항이나 시나리오에 따라 사용 여부를 유연하게 결정할 수 있습니다.
사전 요구 사항
- Microsoft Fabric에서 의료 데이터 솔루션 배포.
- 의료 데이터 기반 배포에 기초 Notebook과 파이프라인을 설치합니다.
OMOP 변환 배포
의료 데이터 솔루션: 의료 데이터 기반 배포에서 설명한 설정 모듈을 사용하여 기능을 배포할 수 있습니다. 그러나 이 모듈의 샘플 데이터 선택 단계에서는 이 기능에 대한 샘플 데이터를 배포하지 않습니다. OMOP 변환 샘플 데이터는 기능 배포를 완료한 후 의료 데이터 솔루션 환경에만 설치됩니다.
설치 모듈을 사용하여 기능을 배포하지 않고 대신 기능 타일을 사용하려면 다음 단계를 수행합니다.
Fabric의 의료 데이터 솔루션 홈 페이지로 이동합니다.
OMOP 변환 타일을 선택합니다.
기능 페이지에서 작업 영역에 배포를 선택합니다.
배포를 완료하는 데 몇 분 정도 걸릴 수 있습니다. 배포가 진행되는 동안 탭이나 브라우저를 닫지 마세요. 기다리는 동안 다른 탭에서 작업할 수 있습니다.
배포가 완료되면 메시지 표시줄에서 알림을 볼 수 있습니다.
메시지 표시줄에서 기능 관리를 선택하면 기능 관리 페이지로 이동합니다.
여기에서 기능과 함께 배포된 아티팩트를 보고, 구성하고, 관리할 수 있습니다.
아티팩트
이 기능은 의료 데이터 솔루션 환경에 다음 아티팩트를 설치합니다.
아티팩트 | Type |
---|---|
healthcare#_msft_gold_omop | 레이크하우스 |
healthcare#_msft_omop_silver_gold_transformation | 전자 필기장 |
healthcare#_msft_omop_drug_exposure_era_sample | 전자 필기장 |
healthcare#_msft_omop_drug_exposure_insights_sample | 전자 필기장 |
healthcare#_msft_omop_analytics | 데이터 파이프라인 |
healthcare#_msft_omop_semantic_model | 의미 체계 모델 |
Vocab-HDS | 샘플 데이터 |
OMOP 실버 Notebook 검토
healthcare#_msft_omop_silver_gold_transformation Notebook은 데이터 변환을 위해 의료 데이터 솔루션 라이브러리의 일부로 제공되는 OMOP API를 사용합니다. Notebook은 healthcare#_msft_silver 레이크하우스의 리소스를 OMOP Common Data Model로 변환합니다. 그런 다음 변환된 데이터는 OMOP 레이크하우스에 삽입됩니다.
Notebook은 OMOP 변환 데이터 파이프라인을 실행하는 데 필요한 미리 구성된 값으로 배포됩니다. 일부 구성 매개 변수는 전역 구성에서 상속되며 Notebook 수준에서 재정의될 수 있습니다. 기본적으로 Notebook 구성 파일은 변경할 필요가 없습니다. 필요한 경우 사용자 환경에서 해당 Notebook 및 구성 파일을 선택하여 구성을 검토하거나 수정할 수 있습니다.
Notebook 실행에 대한 자세한 내용은 OMOP 변환 사용을 참조하세요.
OMOP 의미 체계 모델 검토
OMOP 의미 체계 모델인 healthcare#_msft_omop_semantic_model은 OMOP 골드 레이크하우스를 기반으로 특별히 구축된 의미 모델입니다. 다음 OMOP 테이블 간의 몇 가지 주요 OMOP CDM 버전 5.4 관계가 포함되어 있습니다.
- 위치
- 사람
- 관찰
- Procedure_Occurrence
- Condition_Occurrence
- 참고
- Drug_Exposure
- Visit_Ocurrence
- Image_Occurrence
- 측정값
이러한 관계는 의료 데이터 솔루션의 코호트 검색 및 구축(프리뷰) 기능에서 Power BI 보고서를 생성하는 데 필요한 최소한의 집합을 형성합니다. 이 의미 체계 모델을 기반으로 사용하여 OMOP 레이크하우스에서 더 많은 OMOP 테이블과 관계를 추가하여 OMOP 표준 레이크하우스 데이터에서 사용자 지정 Power BI 보고서를 만들 수 있습니다.
약물 노출 연대 샘플 Notebook 구성
healthcare#_msft_omop_drug_exposure_era_sample 샘플 Notebook은 주로 탐색 목적으로 Azure Synapse Analytics Notebook에서 PySpark(Python) 언어를 사용하여 OMOP에서 drug_era 테이블 레코드를 생성하는 방법을 보여줍니다. drug_era 테이블 레코드 생성은 Azure Synapse Analytics에서 PySpark와 함께 작동하도록 조정된 OHDSI drug era 샘플 스크립트를 따릅니다. drug era 생성기 코드는 휠(WHL) 파일로 패키징되고 쉽게 액세스할 수 있도록 Apache Spark 풀에 업로드되는 사용자 지정 Python 라이브러리에 포함되어 있습니다.
Notebook을 실행하기 전에 다음 필수 구성 요소에 유의하세요.
OMOP 데이터베이스에 다음 테이블의 유효한 데이터가 있는지 확인합니다.
- drug_exposure
- 개념
- concept_ancestor
FHIR에서 OMOP 데이터 파이프라인을 실행하여 샘플 데이터 또는 자체 데이터를 사용하여 이 데이터를 생성할 수 있습니다.
사용자 지정 라이브러리 휠 패키지가 이 Notebook을 실행하는 데 사용하는 Spark 풀에 연결되어 있는지 확인합니다.
이 Notebook의 주요 구성 매개 변수는 omop_database_name
입니다. 이 매개 변수는 drug_era 테이블을 생성하기 위한 데이터를 포함하는 OMOP 데이터베이스의 이름을 식별합니다. OMOP 데이터베이스가 전역 구성 파일의 기본값과 다른 경우에만 이 값을 업데이트하십시오.
OMOP drug_exposure 테이블이 유효한 데이터로 채워지면 이 노트북은 사람이 활성 약물 성분에 노출된 기간을 함께 연결하는 DrugEraGenerator 모듈을 호출하여 30일의 간격을 허용합니다. DrugEraGenerator 모듈은 기존의 모든 drug_era 레코드를 삭제하고 최신 OMOP 데이터를 기반으로 새로운 레코드를 생성합니다.
Notebook 실행에 대한 자세한 내용은 OMOP 변환 샘플 Notebook을 참조하세요.
약물 노출 인사이트 샘플 Notebook 구성
healthcare#_msft_omop_drug_exposure_insights_sample 샘플 Notebook은 Azure Synapse Analytics Notebook에서 PySpark를 사용하여 drug_era 테이블에 대한 탐색적 분석을 보여줍니다. 이 분석은 활성 성분에 대한 환자의 2차 약물 노출을 보여주는 히스토그램을 생성하며, 특정 연도에 대해 성별 및 연령별로 계층화됩니다. drug_era 테이블은 이전 Notebook healthcare#_msft_omop_drug_exposure_era_sample이 호출하는 사용자 지정 라이브러리 DrugEraGenerator를 사용하여 생성됩니다. 이 분석은 성별과 연령을 기반으로 한 계층화를 통합하여 약물 노출 쿼리 DEX03: 약물에 따른 연령 분포를 확장합니다.
Notebook을 실행하기 전에 다음 필수 구성 요소에 유의하세요.
- Notebook 구성을 편집하려면 이 Notebook의 복사본을 만들어야 합니다. Notebook을 직접 업데이트하지 마세요.
- 약물 노출 연대 Notebook을 실행하여 drug_era 테이블에 데이터가 포함되어 있는지 확인합니다. 이 Notebook을 실행하면 최신 OMOP 데이터를 기반으로 기존 drug_era 레코드가 새로운 레코드로 대체됩니다.
- 예비 분석을 위해 이 Notebook을 있는 그대로 사용하고 복사본을 만들어 사용자 지정 분석을 수행합니다.
다음은 주요 Notebook 구성 매개 변수입니다. 환자 약물 노출에 대한 대체 탐색적 분석을 위해 다음 매개 변수를 수정할 수 있습니다.
primary_drug_concept_id
: 환자에 대한 1차 유효 성분 노출.secondary_drug_concept_id
: 환자에 대한 2차 유효 성분 노출.year
: 환자가 1차 및 2차 약물 모두에 적극적으로 노출된 대상 연도.
Notebook 실행에 대한 자세한 내용은 OMOP 변환 샘플 Notebook을 참조하세요.