ClinVar-annoteringar
ClinVar-resursen är ett fritt tillgängligt offentligt arkiv med rapporter - med stödjande bevis - om relationerna mellan mänskliga variationer och fenotyper. Det underlättar tillgång till och kommunikation om de påstådda relationerna mellan mänsklig variation och observerad hälsostatus, och om den tolkningens historia. Det ger tillgång till en bredare uppsättning kliniska tolkningar som forskare kan införliva i genomikarbetsflöden och program.
Gå till dataordlistan och resursenvanliga frågor och svar om du vill ha mer information om data.
Kommentar
Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.
Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.
Data source
Den här datamängden är en spegling av National Library of Medicine ClinVar FTP-resursen. FTP-resurs
Datauppdateringsfrekvens
Den här datamängden tar emot dagliga uppdateringar.
Lagringsplats
Den här datamängden lagras i Azure-regionerna USA, västra 2 och USA, västra centrala. Vi rekommenderar att du letar upp beräkningsresurser i USA, västra 2 eller USA, västra centrala för tillhörighet.
Dataåtkomst
USA, västra 2:"https://datasetclinvar.blob.core.windows.net/dataset'"
USA, västra centrala: "https://datasetclinvar-secondary.blob.core.windows.net/dataset"
Användningsvillkor
Data är tillgängliga utan begränsningar. Mer information och källhänvisningsinformation finns i Komma åt och använda data i ClinVar.
Kontakt
Om du vill ha frågor eller feedback om den här datauppsättningen kontaktar du clinvar@ncbi.nlm.nih.gov.
Azure Notebooks
Hämta ClinVar-data från Azure Open Dataset
Flera offentliga genomikdataresurser laddades upp som Azure Open Dataset på den här resursen.
Anropa data från "ClinVar Data Set"
import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os
REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR
with mount:
print(os.listdir(path))
import pandas as pd
# create mount context
mount.start()
# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')
# read README file
metadata = pd.read_table(metadata_filename)
metadata
Ladda ned den specifika filen
import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess
blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')
Nästa steg
Visa resten av datauppsättningarna i katalogen Öppna datamängder.