共用方式為


ClinVar 註釋

ClinVar 資源是一種自由存取、公開的報表封存,其中包含關於人類變異和表型之間的關係的支持證據。 有助於存取和溝通人類變異與觀察到的健康狀態之間所聲稱的關係,以及該解釋的歷史。 提供一組更廣泛的臨床解釋,研究人員可以納入基因組工作流程和應用程式。

如需資料的詳細資訊,請瀏覽資料字典常見問題資源

注意

Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。

此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。

資料來源

此資料集是國家醫學圖書館 ClinVar FTP 資源的鏡像。 FTP 資源

FTP 概觀

資料更新頻率

此資料集會收到每日更新。

儲存位置

本資料集儲存於美國西部 2 及美國中西部 Azure 區域。 我們建議您在美國西部 2 或美國中西部配置計算資源,以確保同質性。

資料存取

美國西部 2:“'https://datasetclinvar.blob.core.windows.net/dataset”

美國中西部:“https://datasetclinvar-secondary.blob.core.windows.net/dataset"

使用條款

資料可供使用且不受限制。 如需詳細資訊和引文詳細資料,請參閱在 ClinVar 中存取和使用資料

連絡人

如有任何此資料集的問題或意見反應,請連絡 clinvar@ncbi.nlm.nih.gov

Azure Notebooks

從 Azure 開放資料集取得 ClinVar 資料

資源,數個公用 Genomics 資料資源會上傳為 Azure 開放資料集。

從「ClinVar 資料集」呼叫資料

import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import  Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os

REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR

with mount:
    print(os.listdir(path))
import pandas as pd

# create mount context
mount.start()

# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')

# read README file
metadata = pd.read_table(metadata_filename)
metadata

下載特定檔案

import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess

blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')     
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')

下一步

檢視開放資料集目錄中的其餘資料集。