Genomics Data Lake

Artykuł
10/24/2024

Usługa Genomics Data Lake udostępnia różne publiczne zestawy danych, do których można uzyskać bezpłatny dostęp i zintegrować je z przepływami pracy i aplikacjami analizy genomics. Zestawy danych obejmują sekwencje genów, informacje o odmianach oraz metadane podmiotów/próbek w formatach plików BAM, FASTA, VCF i CSV.

Zestaw Genomics Data Lake jest hostowany w regionie świadczenia usługi Azure Zachodnie stany USA 2 i Zachodnio-środkowe stany USA. Zalecamy przydzielanie zasobów obliczeniowych w regionie Zachodnie stany USA 2 i Zachodnio-środkowe stany USA z uwagi na koligację.

Uwaga

Korzystanie z zestawów danych podlega warunkom i warunkom określonym przez właścicieli zestawów danych. Zobacz stronę szczegółów dla każdego zestawu danych, aby uzyskać odpowiednie warunki i postanowienia.

Zestawy danych

Zestawy danych	opis
Illumina Platinum Genomes	Illumina Platinum Genomes
Referencyjne genomy ludzkie	Referencyjne genomy ludzkie
ClinVar Annotations	ClinVar Annotations
SnpEff	SnpEff: Adnotacje wariantów genomicznych i przybornik przewidywania efektów funkcjonalnych
gnomAD	gnomAD: Baza danych agregacji Genome
1000 Genomes	1000 Genomes
OpenCravat	OpenCravat: otwórz niestandardową analizę rankingowej zestawu narzędzi Variant Toolkit
KODOWAĆ	ENCODE: Encyklopedia elementów DNA
Pakiet zasobów GATK	Pakiet zasobów GATK
Otwarte dane TCGA	Otwarte dane TCGA
Pan UK-Biobank	Pan UK-Biobank
Baza danych ImmuneCODE	Baza danych ImmuneCODE
Otwórz zestaw danych Targets	Otwórz zestaw danych Targets

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).

Udostępnij za pośrednictwem

Genomics Data Lake

Zestawy danych

Następne kroki

Opinia

Dodatkowe zasoby