다음을 통해 공유


의료 데이터 솔루션에서 OMOP 변환 샘플 Notebook 사용

참고

이 콘텐츠는 현재 업데이트 중입니다.

이 섹션에서는 두 가지 OMOP(Observational Medical Outcomes Partnership) 샘플 시나리오를 보여줍니다. 이러한 시나리오는 환자 집단 전반의 1차 및 2차 약물에 대한 노출과 관련하여 OMOP 커뮤니티에서 수행한 일반적인 임상 연구 조사를 반영합니다. 시간 대비 가치 관점에서, Fabric 작업 영역 내에서 분석 결과를 얼마나 빨리 시각화할 수 있는지 보여줍니다. 데이터 파이프라인이 각각 실버 및 골드 레이크하우스에서 FHIR(전자 의료 기록 교환) 임상 데이터를 채운 후 샘플 노트북을 실행하여 이 시각화를 달성할 수 있습니다.

사전 요구 사항

샘플 Notebook healthcare#_msft_omop_drug_exposure_era_samplehealthcare#_msft_omop_drug_exposure_insights_sample을 실행하기 전에 다음 요건을 갖추었는지 확인합니다.

샘플 시나리오

샘플 시나리오는 동일한 1차 약물을 복용하는 동안 특정 기간 동안 2차 약물에 노출된 성별 및 연령별로 계층화된 환자 집단을 식별하는 것을 목표로 합니다. 이 프로세스에는 다음 단계가 포함됩니다.

  • 성별 및 연령별로 환자 모집단을 계층화합니다.

  • 환자 집단이 1년 동안 복용한 약물(예: 인슐린 이소포판, 인간 70 UNT/ML/인슐린, 일반, 인간 30단위)을 최소 한 번 식별합니다.

    데이터가 충분하지 않은 경우 대신 5년의 기간을 고려합니다.

  • 동일한 환자 집단이 동일한 기간 동안 노출된 다른 약물(두 번째 약물)을 식별합니다.

  • 성별 계층에 걸친 2차 약물 노출의 분포를 플로팅합니다.

  • 레코드를 생성하고 분포를 히스토그램 플롯으로 시각화합니다.

샘플 시나리오는 OHDSI 약물 연대 샘플 스크립트OMOP 약물 노출 쿼리를 참조합니다. 이러한 리소스를 검토하여 OMOP 커뮤니티에서 게시한 유사한 예제에 대해 자세히 알아볼 수 있습니다.

샘플 Notebook 실행 입력

개발 설계의 주요 목적은 OMOP 표준화 파생 테이블 drug_era로 표시되는 약물 연대 레코드를 생성하는 것입니다. 이 테이블에는 사람, 약물 성분 및 지속성 기간별로 그룹화된 약물 노출에 대한 집계 정보가 포함된 계산된 약물 연대가 저장됩니다. 이는 개별 약물 노출 기록과 구별되는 특정 활성 성분에 대한 지속적인 노출 기간을 나타냅니다.

이 테이블에 다음과 같은 열이 포함되어 있습니다.

  • drug_era_id: 약물 연대별 고유 식별자입니다.

  • person_id: Person 테이블에 인구 통계적 세부 정보가 있는 약물에 노출된 사람을 참조하는 외래 키입니다.

  • drug_concept_id: 활성 성분에 대한 표준화된 개념 식별자를 나타내는 외래 키입니다.

  • drug_era_start_date: 첫 번째 약물 노출에서 파생된 약물 연대의 시작일입니다.

  • drug_era_end_date: 마지막 약물 노출을 기준으로 한 약물 연대의 종료 날짜입니다.

  • drug_exposure_count: 약물 연대 동안 약물에 노출된 총 횟수입니다.

  • gap_days: 약물 연대에 기여한 약물 노출 레코드가 적용되지 않는 일 수입니다.

약물 연대 레코드를 생성하기 위해 다음과 같은 OMOP 표준화 임상 테이블을 사용합니다.

  • 약물 노출: 이 테이블에는 drug_exposure_id, person_id, drug_concept_id, drug_exposure_start_date, drug_exposure_end_date, days_supply를 포함한 약물 노출 데이터가 포함되어 있습니다.

  • 개념 상위 항목: 이 테이블은 RxNorm과 같은 다양한 어휘의 개념 간의 계층적 관계를 저장합니다. 여기에는 ancestor_concept_id(상위 수준 개념에 대한 참조)와 descendant_concept_id(하위 수준 개념에 대한 참조)가 포함되며, 더 넓은 개념에서 더 좁은 개념 연결을 나타냅니다.

  • 개념: 이 테이블에는, concept_id, concept_name, domain_id, vocabulary_id, concept_class_id를 포함한 개념 데이터가 포함되어 있습니다.

샘플 입력 매개 변수

  • primary_drug = 1596977 - insulin
  • secondary_drug = 1308216 - lisinopril
  • year = 2022

샘플 Notebook 출력

두 개의 샘플 Notebook을 실행하면 파생된 OMOP 테이블 omop.drug_era에서 특정 기간 동안 식별된 환자 모집단의 성별 및 연령 계층에 따른 2차 약물 노출 분포를 나타내는 히스토그램이 생성됩니다. 이 예에서는 1년의 기간을 고려합니다.

샘플 약물 노출 히스토그램을 표시하는 이미지.

분포를 사용하여 다음과 같은 측면을 분석할 수 있습니다.

  • 성별 및 연령별 노출의 영향.
  • 영향을 받는 모집단의 중앙값 분포.
  • 모집단의 특성을 설명하는 기술 통계입니다.

기억해야 할 사항

  • 사용자 지정 시나리오를 테스트하려면 샘플 Notebook의 복사본을 만듭니다. Notebook을 직접 업데이트하지 마세요.

  • 시각화 Notebook은 다양한 분석을 실행하도록 구성할 수 있는 다음 매개 변수를 사용합니다.

    • primary_drug: 분석하는 1차 약물입니다.
    • secondary_drug: 분석하는 2차 약물입니다.
    • year: 분석을 수행해야 하는 연도입니다.
  • 약물 노출 연대 Notebook을 여러 번 실행하면 먼저 기존의 OMOP drug_era 레코드가 모두 삭제된 다음 최신 OMOP 데이터를 기반으로 레코드를 다시 만듭니다.