Compartir vía


ClinVar Annotations

El recurso ClinVar es un archivo público libremente accesible de informes, con pruebas complementarias, sobre las relaciones entre variaciones humanas y fenotipos. Facilita el acceso y la comunicación sobre las aparentes relaciones entre la variación humana y el estado de salud observado, y sobre la historia de esa interpretación. Proporciona acceso a un conjunto más amplio de interpretaciones clínicas que los investigadores pueden incorporar en flujos de trabajo y aplicaciones genómicos.

Visite el diccionario de datos y los recursos de preguntas más frecuentes para obtener más información sobre los datos.

Nota:

Microsoft proporciona Azure Open Datasets "tal cual". Microsoft no ofrece ninguna garantía, expresa o implícita, ni condición con respecto al uso que usted haga de los conjuntos de datos. En la medida en la que lo permita su legislación local, Microsoft declina toda responsabilidad por posibles daños o pérdidas, incluidos los daños directos, consecuenciales, especiales, indirectos, incidentales o punitivos, que resulten de su uso de los conjuntos de datos.

Este conjunto de datos se proporciona bajo los términos originales con los que Microsoft recibió los datos de origen. El conjunto de datos puede incluir datos procedentes de Microsoft.

Origen de datos

Este conjunto de datos es un reflejo del recurso FTP de la Biblioteca Nacional de Medicina ClinVar. Recurso FTP

Introducción a FTP

Frecuencia de actualización de los datos

Este conjunto de datos recibe actualizaciones diarias.

Ubicación de almacenamiento

Este conjunto de datos se almacena en las regiones Oeste de EE. UU. 2 y Centro-oeste de EE. UU. de Azure. Por afinidad, se recomienda asignar recursos de proceso de Oeste de EE. UU. 2 o Centro-oeste de EE. UU.

Acceso a datos

Oeste de EE. UU. 2:"https://datasetclinvar.blob.core.windows.net/dataset'"

Centro-oeste de EE. UU.: "https://datasetclinvar-secondary.blob.core.windows.net/dataset"

Términos de uso

Los datos están disponibles sin restricciones. Para más información y detalles de cita, consulte Uso de datos y acceso a estos en ClinVar.

Contacto

Si tiene alguna pregunta o comentario sobre este conjunto de datos, póngase en contacto con clinvar@ncbi.nlm.nih.gov.

Azure Notebooks

Obtención de los datos ClinVar de Azure Open Datasets

Varios recursos de datos genómicos públicos se cargaron como Azure Open Dataset en este recurso.

Llamada a los datos desde el "conjunto de datos de ClinVar"

import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import  Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os

REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR

with mount:
    print(os.listdir(path))
import pandas as pd

# create mount context
mount.start()

# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')

# read README file
metadata = pd.read_table(metadata_filename)
metadata

Descarga del archivo específico

import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess

blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')     
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')

Pasos siguientes

Consulte el resto de los conjuntos de datos en el catálogo de Open Datasets.