ClinVar Annotations
De ClinVar-resource is een vrij toegankelijk, openbaar archief van rapporten - met ondersteunende bewijzen - over de relaties tussen menselijke variaties en fenotypen. Het vergemakkelijkt de toegang tot en communicatie over de geclaimde relaties tussen menselijke variatie en waargenomen gezondheidsstatus, en over de geschiedenis van die interpretatie. Het biedt toegang tot een bredere set klinische interpretaties die onderzoekers kunnen opnemen in genomics-werkstromen en -toepassingen.
Ga naar de gegevenswoordenlijst en de veelgestelde vragen voor meer informatie over de gegevens.
Notitie
Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Gegevensbron
Deze gegevensset is een spiegel van de National Library of Medicine ClinVar FTP-resource. FTP-resource
Frequentie van gegevensupdates
Deze gegevensset ontvangt dagelijkse updates.
Opslaglocatie
Deze gegevensset is opgeslagen in de Azure-regio's US - west 2 en VS - west-centraal. We raden u aan rekenresources te zoeken in VS - west 2 of VS - west-centraal voor affiniteit.
Data Access
VS - west 2:"https://datasetclinvar.blob.core.windows.net/dataset""
VS - west-centraal: "https://datasetclinvar-secondary.blob.core.windows.net/dataset"
Gebruiksrechtovereenkomst
De gegevens zijn zonder beperkingen beschikbaar. Zie Gegevens openen en gebruiken in ClinVar voor meer informatie en informatie over bronvermeldingen.
Contactpersoon
Neem voor vragen of feedback over deze gegevensset contact op clinvar@ncbi.nlm.nih.gov.
Azure Notebooks
De ClinVar-gegevens ophalen uit Azure Open Dataset
Er zijn verschillende openbare genomics-gegevensresources geĆ¼pload als Azure Open Dataset bij deze resource.
De gegevens aanroepen vanuit de ClinVar-gegevensset
import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os
REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR
with mount:
print(os.listdir(path))
import pandas as pd
# create mount context
mount.start()
# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')
# read README file
metadata = pd.read_table(metadata_filename)
metadata
Het specifieke bestand downloaden
import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess
blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.