ClinVar Annotations

Artikel
12/12/2024

Die ClinVar-Ressource ist ein frei zugängliches, öffentliches Archiv von Berichten mit unterstützenden Belegen über die Beziehungen zwischen menschlichen Variationen und Phänotypen. Sie erleichtert den Zugang zur behaupteten Beziehungen zwischen menschlicher Vielfalt und beobachtetem Gesundheitsstatus und zur die Geschichte dieser Interpretation sowie die Kommunikation darüber. Sie bietet Zugang zu umfangreicheren klinischer Interpretationen, die Forscher in Genomworkflows und -anwendungen integrieren können.

Weitere Informationen zu den Daten finden im Datenwörterbuch und der FAQ-Ressource.

Hinweis

Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.

Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.

Datenquelle

Dieses Dataset ist ein Datenspiegel der ClinVar-FTP-Ressource der National Library of Medicine. FTP-Ressource

FTP-Übersicht

Aktualisierungshäufigkeit der Daten

Dieses Dataset erhält tägliche Updates.

Speicherort

Dieses Dataset wird in den Azure-Regionen „USA, Westen 2“ und „USA, Westen-Mitte“ gespeichert. Aus Gründen der Affinität wird die Zuweisung von Computeressourcen in den Regionen „USA, Westen 2“ oder „USA, Westen-Mitte“ empfohlen.

Datenzugriff

USA, Westen 2: „https://datasetclinvar.blob.core.windows.net/dataset“

USA, Westen-Mitte: „https://datasetclinvar-secondary.blob.core.windows.net/dataset"“

Nutzungsbedingungen

Die Daten stehen uneingeschränkt zur Verfügung. Weitere Informationen und Zitatdetails finden Sie unter Zugreifen auf und Verwenden von Daten in ClinVar.

Contact

Bei Fragen oder Feedback zu diesem Dataset wenden Sie sich an clinvar@ncbi.nlm.nih.gov.

Azure Notebooks

azure-storage

Abrufen der ClinVar-Daten aus Azure Open Dataset

Mehrere öffentliche Genomdatenressourcen wurden in dieser Ressource als Azure Open Dataset hochgeladen.

Aufrufen der Daten aus „ClinVar Data Set“

import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)

from azureml.core import  Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()

import os

REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR

with mount:
    print(os.listdir(path))

import pandas as pd

# create mount context
mount.start()

# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')

# read README file
metadata = pd.read_table(metadata_filename)
metadata

Herunterladen der Datei

import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess

blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')     
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')

Nächste Schritte

Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.

Freigeben über