Genomics Data Lake
「基因體學資料湖」提供多種公開資料集,可供您免費存取,並整合到您的基因體分析工作流程及應用程式。 本資料集包含基因體序列、變異資訊,以及 BAM、FASTA、VCF、CSV 檔案格式的主體/樣本中繼資料。
Genomics Data Lake 裝載於美國西部 2 與美國中西部 Azure 區域。 建議您在美國西部 2 和美國中西部配置計算資源,以確保同質性。
注意
使用資料集須遵守資料集擁有者設立的條款及條件。 有關適用的條款及條件,請參閱各資料集的詳細資料頁面。
資料集
資料集 | 描述 |
---|---|
Illumina Platinum Genomes | Illumina Platinum Genomes |
人類參考基因體 | 人類參考基因體 |
ClinVar 註釋 | ClinVar 註釋 |
SnpEff | SnpEff: Genomic Variant 註釋和功能效果預測工具箱 |
gnomAD | gnomAD:基因組彙總資料庫 |
千人基因組 | 千人基因組 |
OpenCravat | OpenCravat: 開啟 Variants 工具組的自訂排名分析 |
編碼 | 編碼: DNA 元素的百科全書 |
GATK 資源搭售方案 | GATK 資源套件組合 |
TCGA Open Data | TCGA Open Data |
Pan UK-Biobank | Pan UK-Biobank |
ImmuneCODE 資料庫 | ImmuneCODE 資料庫 |
開啟目標數據集 | 開啟目標數據集 |
下一步
檢視開放資料集目錄中的其餘資料集。