共用方式為


Genomics Data Lake

「基因體學資料湖」提供多種公開資料集,可供您免費存取,並整合到您的基因體分析工作流程及應用程式。 本資料集包含基因體序列、變異資訊,以及 BAM、FASTA、VCF、CSV 檔案格式的主體/樣本中繼資料。

Genomics Data Lake 裝載於美國西部 2 與美國中西部 Azure 區域。 建議您在美國西部 2 和美國中西部配置計算資源,以確保同質性。

注意

使用資料集須遵守資料集擁有者設立的條款及條件。 有關適用的條款及條件,請參閱各資料集的詳細資料頁面。

資料集

資料集 描述
Illumina Platinum Genomes Illumina Platinum Genomes
人類參考基因體 人類參考基因體
ClinVar 註釋 ClinVar 註釋
SnpEff SnpEff: Genomic Variant 註釋和功能效果預測工具箱
gnomAD gnomAD:基因組彙總資料庫
千人基因組 千人基因組
OpenCravat OpenCravat: 開啟 Variants 工具組的自訂排名分析
編碼 編碼: DNA 元素的百科全書
GATK 資源搭售方案 GATK 資源套件組合
TCGA Open Data TCGA Open Data
Pan UK-Biobank Pan UK-Biobank
ImmuneCODE 資料庫 ImmuneCODE 資料庫
開啟目標數據集 開啟目標數據集

下一步

檢視開放資料集目錄中的其餘資料集。