ClinVar-annoteringar

Artikel
12/12/2024

ClinVar-resursen är ett fritt tillgängligt offentligt arkiv med rapporter - med stödjande bevis - om relationerna mellan mänskliga variationer och fenotyper. Det underlättar tillgång till och kommunikation om de påstådda relationerna mellan mänsklig variation och observerad hälsostatus, och om den tolkningens historia. Det ger tillgång till en bredare uppsättning kliniska tolkningar som forskare kan införliva i genomikarbetsflöden och program.

Gå till dataordlistan och resursenvanliga frågor och svar om du vill ha mer information om data.

Kommentar

Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.

Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.

Data source

Den här datamängden är en spegling av National Library of Medicine ClinVar FTP-resursen. FTP-resurs

FTP-översikt

Datauppdateringsfrekvens

Den här datamängden tar emot dagliga uppdateringar.

Lagringsplats

Den här datamängden lagras i Azure-regionerna USA, västra 2 och USA, västra centrala. Vi rekommenderar att du letar upp beräkningsresurser i USA, västra 2 eller USA, västra centrala för tillhörighet.

Dataåtkomst

USA, västra 2:"https://datasetclinvar.blob.core.windows.net/dataset'"

USA, västra centrala: "https://datasetclinvar-secondary.blob.core.windows.net/dataset"

Användningsvillkor

Data är tillgängliga utan begränsningar. Mer information och källhänvisningsinformation finns i Komma åt och använda data i ClinVar.

Kontakt

Om du vill ha frågor eller feedback om den här datauppsättningen kontaktar du clinvar@ncbi.nlm.nih.gov.

Azure Notebooks

azure-storage

Hämta ClinVar-data från Azure Open Dataset

Flera offentliga genomikdataresurser laddades upp som Azure Open Dataset på den här resursen.

Anropa data från "ClinVar Data Set"

import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)

from azureml.core import  Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()

import os

REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR

with mount:
    print(os.listdir(path))

import pandas as pd

# create mount context
mount.start()

# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')

# read README file
metadata = pd.read_table(metadata_filename)
metadata

Ladda ned den specifika filen

import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess

blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')     
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')

Nästa steg

Visa resten av datauppsättningarna i katalogen Öppna datamängder.

Dela via