Genomics Data Lake
Usługa Genomics Data Lake udostępnia różne publiczne zestawy danych, do których można uzyskać bezpłatny dostęp i zintegrować je z przepływami pracy i aplikacjami analizy genomics. Zestawy danych obejmują sekwencje genów, informacje o odmianach oraz metadane podmiotów/próbek w formatach plików BAM, FASTA, VCF i CSV.
Zestaw Genomics Data Lake jest hostowany w regionie świadczenia usługi Azure Zachodnie stany USA 2 i Zachodnio-środkowe stany USA. Zalecamy przydzielanie zasobów obliczeniowych w regionie Zachodnie stany USA 2 i Zachodnio-środkowe stany USA z uwagi na koligację.
Uwaga
Korzystanie z zestawów danych podlega warunkom i warunkom określonym przez właścicieli zestawów danych. Zobacz stronę szczegółów dla każdego zestawu danych, aby uzyskać odpowiednie warunki i postanowienia.
Zestawy danych
Zestawy danych | opis |
---|---|
Illumina Platinum Genomes | Illumina Platinum Genomes |
Referencyjne genomy ludzkie | Referencyjne genomy ludzkie |
ClinVar Annotations | ClinVar Annotations |
SnpEff | SnpEff: Adnotacje wariantów genomicznych i przybornik przewidywania efektów funkcjonalnych |
gnomAD | gnomAD: Baza danych agregacji Genome |
1000 Genomes | 1000 Genomes |
OpenCravat | OpenCravat: otwórz niestandardową analizę rankingowej zestawu narzędzi Variant Toolkit |
KODOWAĆ | ENCODE: Encyklopedia elementów DNA |
Pakiet zasobów GATK | Pakiet zasobów GATK |
Otwarte dane TCGA | Otwarte dane TCGA |
Pan UK-Biobank | Pan UK-Biobank |
Baza danych ImmuneCODE | Baza danych ImmuneCODE |
Otwórz zestaw danych Targets | Otwórz zestaw danych Targets |
Następne kroki
Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).