Sdílet prostřednictvím


Poznámky ClinVar

Zdroj ClinVar je volně přístupný veřejný archiv zpráv - s podpůrnými důkazy - vztahy mezi lidskými variacemi a fenotypy. Usnadňuje přístup k požadovaným vztahům mezi lidskou variací a pozorovaným stavem a o historii tohoto výkladu a komunikaci o něm. Poskytuje přístup k širší sadě klinických interpretací, které mohou vědci začlenit do pracovních postupů a aplikací genomiky.

Další informace o datech najdete ve slovníku dat a v nejčastějších dotazech.

Poznámka:

Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Zdroj dat

Tato datová sada je zrcadlem prostředku FTP národní knihovny lékařství ClinVar. Prostředek FTP

Přehled FTP

Frekvence aktualizace dat

Tato datová sada přijímá denní aktualizace.

Dočasné úložiště

Tato datová sada se uchovává v těchto oblastech Azure: USA – středozápad a USA – západ 2. Pro spřažení doporučujeme umístit výpočetní prostředky do oblasti USA – západ 2 nebo USA – středozápad.

Přístup k datům

USA – západ 2:"https://datasetclinvar.blob.core.windows.net/dataset""

USA – středozápad: "https://datasetclinvar-secondary.blob.core.windows.net/dataset"

Podmínky použití

Data jsou k dispozici bez omezení. Další informace a podrobnosti citace najdete v tématu Přístup k datům v ClinVar a jejich používání.

Kontakt

Pokud máte jakékoli dotazy nebo zpětnou vazbu k této datové sadě, obraťte se na clinvar@ncbi.nlm.nih.gov.

Azure Notebooks

Získání dat ClinVar z Azure Open Dataset

Několik veřejných datových prostředků genomics se nahrálo jako Azure Open Dataset v tomto prostředku.

Volání dat ze sady dat ClinVar

import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import  Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os

REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR

with mount:
    print(os.listdir(path))
import pandas as pd

# create mount context
mount.start()

# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')

# read README file
metadata = pd.read_table(metadata_filename)
metadata

Stažení konkrétního souboru

import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess

blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')     
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')

Další kroky

Prohlédněte si zbývající datové sady v katalogu Open Datasets.