의료 데이터 솔루션에서 OMOP 변환 샘플 Notebook 사용
참고
이 콘텐츠는 현재 업데이트 중입니다.
이 섹션에서는 두 가지 OMOP(Observational Medical Outcomes Partnership) 샘플 시나리오를 보여줍니다. 이러한 시나리오는 환자 집단 전반의 1차 및 2차 약물에 대한 노출과 관련하여 OMOP 커뮤니티에서 수행한 일반적인 임상 연구 조사를 반영합니다. 시간 대비 가치 관점에서, Fabric 작업 영역 내에서 분석 결과를 얼마나 빨리 시각화할 수 있는지 보여줍니다. 데이터 파이프라인이 각각 실버 및 골드 레이크하우스에서 FHIR(전자 의료 기록 교환) 임상 데이터를 채운 후 샘플 노트북을 실행하여 이 시각화를 달성할 수 있습니다.
사전 요구 사항
샘플 Notebook healthcare#_msft_omop_drug_exposure_era_sample 및 healthcare#_msft_omop_drug_exposure_insights_sample을 실행하기 전에 다음 요건을 갖추었는지 확인합니다.
OMOP 데이터베이스가 생성되고 샘플 데이터로 채워졌는지 확인합니다.
OMOP 변환 배포에서 설명한 대로 사용자 환경에 OMOP 샘플 데이터를 배포하고 설정합니다.
다음에 설명된 대로 샘플 Notebook 구성을 검토합니다.
샘플 시나리오
샘플 시나리오는 동일한 1차 약물을 복용하는 동안 특정 기간 동안 2차 약물에 노출된 성별 및 연령별로 계층화된 환자 집단을 식별하는 것을 목표로 합니다. 이 프로세스에는 다음 단계가 포함됩니다.
성별 및 연령별로 환자 모집단을 계층화합니다.
환자 집단이 1년 동안 복용한 약물(예: 인슐린 이소포판, 인간 70 UNT/ML/인슐린, 일반, 인간 30단위)을 최소 한 번 식별합니다.
데이터가 충분하지 않은 경우 대신 5년의 기간을 고려합니다.
동일한 환자 집단이 동일한 기간 동안 노출된 다른 약물(두 번째 약물)을 식별합니다.
성별 계층에 걸친 2차 약물 노출의 분포를 플로팅합니다.
레코드를 생성하고 분포를 히스토그램 플롯으로 시각화합니다.
팁
샘플 시나리오는 OHDSI 약물 연대 샘플 스크립트 및 OMOP 약물 노출 쿼리를 참조합니다. 이러한 리소스를 검토하여 OMOP 커뮤니티에서 게시한 유사한 예제에 대해 자세히 알아볼 수 있습니다.
샘플 Notebook 실행 입력
개발 설계의 주요 목적은 OMOP 표준화 파생 테이블 drug_era로 표시되는 약물 연대 레코드를 생성하는 것입니다. 이 테이블에는 사람, 약물 성분 및 지속성 기간별로 그룹화된 약물 노출에 대한 집계 정보가 포함된 계산된 약물 연대가 저장됩니다. 이는 개별 약물 노출 기록과 구별되는 특정 활성 성분에 대한 지속적인 노출 기간을 나타냅니다.
이 테이블에 다음과 같은 열이 포함되어 있습니다.
drug_era_id
: 약물 연대별 고유 식별자입니다.person_id
: Person 테이블에 인구 통계적 세부 정보가 있는 약물에 노출된 사람을 참조하는 외래 키입니다.drug_concept_id
: 활성 성분에 대한 표준화된 개념 식별자를 나타내는 외래 키입니다.drug_era_start_date
: 첫 번째 약물 노출에서 파생된 약물 연대의 시작일입니다.drug_era_end_date
: 마지막 약물 노출을 기준으로 한 약물 연대의 종료 날짜입니다.drug_exposure_count
: 약물 연대 동안 약물에 노출된 총 횟수입니다.gap_days
: 약물 연대에 기여한 약물 노출 레코드가 적용되지 않는 일 수입니다.
약물 연대 레코드를 생성하기 위해 다음과 같은 OMOP 표준화 임상 테이블을 사용합니다.
약물 노출: 이 테이블에는
drug_exposure_id
,person_id
,drug_concept_id
,drug_exposure_start_date
,drug_exposure_end_date
,days_supply
를 포함한 약물 노출 데이터가 포함되어 있습니다.개념 상위 항목: 이 테이블은 RxNorm과 같은 다양한 어휘의 개념 간의 계층적 관계를 저장합니다. 여기에는
ancestor_concept_id
(상위 수준 개념에 대한 참조)와descendant_concept_id
(하위 수준 개념에 대한 참조)가 포함되며, 더 넓은 개념에서 더 좁은 개념 연결을 나타냅니다.개념: 이 테이블에는,
concept_id
,concept_name
,domain_id
,vocabulary_id
,concept_class_id
를 포함한 개념 데이터가 포함되어 있습니다.
샘플 입력 매개 변수
primary_drug
=1596977 - insulin
secondary_drug
=1308216 - lisinopril
year
=2022
샘플 Notebook 출력
두 개의 샘플 Notebook을 실행하면 파생된 OMOP 테이블 omop.drug_era에서 특정 기간 동안 식별된 환자 모집단의 성별 및 연령 계층에 따른 2차 약물 노출 분포를 나타내는 히스토그램이 생성됩니다. 이 예에서는 1년의 기간을 고려합니다.
분포를 사용하여 다음과 같은 측면을 분석할 수 있습니다.
- 성별 및 연령별 노출의 영향.
- 영향을 받는 모집단의 중앙값 분포.
- 모집단의 특성을 설명하는 기술 통계입니다.
기억해야 할 사항
사용자 지정 시나리오를 테스트하려면 샘플 Notebook의 복사본을 만듭니다. Notebook을 직접 업데이트하지 마세요.
시각화 Notebook은 다양한 분석을 실행하도록 구성할 수 있는 다음 매개 변수를 사용합니다.
primary_drug
: 분석하는 1차 약물입니다.secondary_drug
: 분석하는 2차 약물입니다.year
: 분석을 수행해야 하는 연도입니다.
약물 노출 연대 Notebook을 여러 번 실행하면 먼저 기존의 OMOP drug_era 레코드가 모두 삭제된 다음 최신 OMOP 데이터를 기반으로 레코드를 다시 만듭니다.