ClinVar Annotations
O recurso ClinVar é um arquivo público e de livre acesso de relatórios - com evidências de apoio - sobre as relações entre variações e fenótipos humanos. Facilita o acesso e a comunicação sobre as alegadas relações entre a variação humana e o estado de saúde observado, e sobre a história dessa interpretação. Ele fornece acesso a um conjunto mais amplo de interpretações clínicas que os pesquisadores podem incorporar em fluxos de trabalho e aplicações genômicas.
Visite o Dicionário de Dados e o recurso FAQ para obter mais informações sobre os dados.
Nota
A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.
Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.
Data source
Este conjunto de dados é um espelho do recurso FTP ClinVar da Biblioteca Nacional de Medicina. Recurso FTP
Frequência de atualização de dados
Este conjunto de dados recebe atualizações diárias.
Localização de armazenamento
Este conjunto de dados está armazenado nas regiões E.U.A. Oeste 2 e E.U.A. Centro-Oeste do Azure. Recomendamos localizar recursos de computação no Oeste dos EUA 2 ou no Centro-Oeste dos EUA por afinidade.
Acesso a Dados
Oeste dos EUA 2:"https://datasetclinvar.blob.core.windows.net/dataset'"
Centro-Oeste dos EUA: "https://datasetclinvar-secondary.blob.core.windows.net/dataset"
Termos de Utilização
Os dados estão disponíveis sem restrições. Mais informações e detalhes da citação, consulte Acesso e uso de dados no ClinVar.
Contacto
Para quaisquer perguntas ou comentários sobre este conjunto de dados, entre em contato com clinvar@ncbi.nlm.nih.gov.
Azure Notebooks
Obtendo os dados ClinVar do Conjunto de Dados Abertos do Azure
Vários recursos públicos de dados de genômica foram carregados como Conjunto de Dados Abertos do Azure neste recurso.
Chamando os dados do 'ClinVar Data Set'
import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os
REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR
with mount:
print(os.listdir(path))
import pandas as pd
# create mount context
mount.start()
# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')
# read README file
metadata = pd.read_table(metadata_filename)
metadata
Descarregar o ficheiro específico
import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess
blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')
Próximos passos
Exiba o restante dos conjuntos de dados no catálogo Open Datasets.