ClinVar Annotations
Zasób ClinVar jest bezpłatnie dostępnym publicznym archiwum raportów - z dowodami pomocniczymi - o relacjach między odmianami ludzkimi i fenotypami. Ułatwia ona dostęp do i komunikację na temat oświadczeń relacji między zmiennością ludzką a obserwowanym stanem zdrowia oraz historią tej interpretacji. Zapewnia ona dostęp do szerszego zestawu interpretacji klinicznych, które naukowcy mogą uwzględnić w przepływach pracy i aplikacjach genomiki.
Odwiedź zasób Słownik danych i często zadawane pytania, aby uzyskać więcej informacji na temat danych.
Uwaga
Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.
Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.
Źródło danych
Ten zestaw danych jest duplikatem zasobu National Library of Medicine ClinVar FTP. Zasób FTP
Częstotliwość aktualizacji danych
Ten zestaw danych otrzymuje codzienne aktualizacje.
Lokalizacja usługi Storage
Ten zestaw danych jest przechowywany w regionach świadczenia platformy Azure: Zachodnie stany USA 2 i Zachodnio-środkowe stany USA. Zalecamy lokalizowanie zasobów obliczeniowych w regionie Zachodnie stany USA 2 lub Zachodnio-środkowe stany USA w celu koligacji.
Dostęp do danych
Zachodnie stany USA 2:"https://datasetclinvar.blob.core.windows.net/dataset""
Zachodnie środkowe stany USA: "https://datasetclinvar-secondary.blob.core.windows.net/dataset"
Warunki użytkowania
Dane są dostępne bez ograniczeń. Więcej informacji i szczegółów cytatu znajduje się w temacie Uzyskiwanie dostępu do danych i używanie ich w języku ClinVar.
Kontakt biznesowy
Aby uzyskać odpowiedzi na pytania lub opinie dotyczące tego zestawu danych, skontaktuj się z .clinvar@ncbi.nlm.nih.gov
Azure Notebooks
Pobieranie danych ClinVar z zestawu danych Azure Open Dataset
Kilka publicznych zasobów danych genomics zostało przekazanych jako zestaw danych Azure Open w tym zasobie.
Wywoływanie danych z zestawu danych "ClinVar"
import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os
REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR
with mount:
print(os.listdir(path))
import pandas as pd
# create mount context
mount.start()
# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')
# read README file
metadata = pd.read_table(metadata_filename)
metadata
Pobieranie określonego pliku
import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess
blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')
Następne kroki
Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).