ClinVar Annotations
Die ClinVar-Ressource ist ein frei zugängliches, öffentliches Archiv von Berichten mit unterstützenden Belegen über die Beziehungen zwischen menschlichen Variationen und Phänotypen. Sie erleichtert den Zugang zur behaupteten Beziehungen zwischen menschlicher Vielfalt und beobachtetem Gesundheitsstatus und zur die Geschichte dieser Interpretation sowie die Kommunikation darüber. Sie bietet Zugang zu umfangreicheren klinischer Interpretationen, die Forscher in Genomworkflows und -anwendungen integrieren können.
Weitere Informationen zu den Daten finden im Datenwörterbuch und der FAQ-Ressource.
Hinweis
Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.
Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.
Datenquelle
Dieses Dataset ist ein Datenspiegel der ClinVar-FTP-Ressource der National Library of Medicine. FTP-Ressource
Aktualisierungshäufigkeit der Daten
Dieses Dataset erhält tägliche Updates.
Speicherort
Dieses Dataset wird in den Azure-Regionen „USA, Westen 2“ und „USA, Westen-Mitte“ gespeichert. Aus Gründen der Affinität wird die Zuweisung von Computeressourcen in den Regionen „USA, Westen 2“ oder „USA, Westen-Mitte“ empfohlen.
Datenzugriff
USA, Westen 2: „https://datasetclinvar.blob.core.windows.net/dataset“
USA, Westen-Mitte: „https://datasetclinvar-secondary.blob.core.windows.net/dataset"“
Nutzungsbedingungen
Die Daten stehen uneingeschränkt zur Verfügung. Weitere Informationen und Zitatdetails finden Sie unter Zugreifen auf und Verwenden von Daten in ClinVar.
Contact
Bei Fragen oder Feedback zu diesem Dataset wenden Sie sich an clinvar@ncbi.nlm.nih.gov.
Azure Notebooks
Abrufen der ClinVar-Daten aus Azure Open Dataset
Mehrere öffentliche Genomdatenressourcen wurden in dieser Ressource als Azure Open Dataset hochgeladen.
Aufrufen der Daten aus „ClinVar Data Set“
import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os
REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR
with mount:
print(os.listdir(path))
import pandas as pd
# create mount context
mount.start()
# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')
# read README file
metadata = pd.read_table(metadata_filename)
metadata
Herunterladen der Datei
import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess
blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')
Nächste Schritte
Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.