Genomics データ レイク
Genomics データ レイクは、無料でアクセスでき、お使いのゲノミクス解析のワークフローやアプリケーションに統合できるさまざまな公開データセットを提供しています。 データセットには、ゲノム配列、変異情報、被験者/サンプルのメタデータが BAM、FASTA、VCF、CSV ファイル形式で含まれています。
Genomics Data Lake は米国西部 2 および米国中西部 Azure リージョンでホストされています。 アフィニティのため、米国西部 2 と米国中西部にコンピューティング リソースを割り当てることをお勧めします。
Note
データセットの使用は、データセットの所有者により設定された使用条件に基づきます。 適用される使用条件については、各データセットの詳細ページをご覧ください。
データセット
データセット | 説明 |
---|---|
Illumina Platinum Genomes | Illumina Platinum Genomes |
Human Reference Genomes | Human Reference Genomes |
ClinVar Annotations | ClinVar Annotations |
SnpEff | SnpEff: ゲノム バリアントのアノテーションと機能効果予測のツールボックス |
gnomAD | gnomAD: ゲノム集計データベース |
1000 ゲノム | 1000 ゲノム |
OpenCravat | OpenCravat: 変異のオープン カスタム ランク付け分析ツールキット |
ENCODE | ENCODE: DNA 要素の百科事典 |
GATK Resource Bundle | GATK リソース バンドル |
TCGA Open Data | TCGA Open Data |
Pan UK-Biobank | Pan UK-Biobank |
ImmuneCODE データベース | ImmuneCODE データベース |
ターゲット データセットを開く | ターゲット データセットを開く |
次のステップ
Open Datasets カタログの残りのデータセットを表示します。