TCGA 開放資料
The Cancer Genome Atlas (TCGA) 是一項劃時代的癌症基因體學計畫,對 20,000 多種原發性癌症進行了分子特徵分析,並比對了跨 33 種癌症類型的常態樣本[1]。 公開提供的 TCGA 癌症資料有兩層:開放存取或受控存取。
- 開放存取 [適用於 Azure]:此資料集包含去身分識別的臨床和生物檢體資料,或不含任何個人識別資訊的摘要資料。 包含的資料類型包括基因表現、甲基化 Beta 值和蛋白質定量。 DNA 層級資料類型包括基因層級複製數 (Gene Level Copy Number) 和遮罩複製數片段 (Masked Copy Number Segment)。
- 受控存取:此資料集是個別層級序列資料,需要透過 dbGap 核准才能存取。
注意
Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。
此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。
資料來源
此資料集真實地反映 TCGA 開放資料
資料量和更新頻率
此資料集包含大約 387 GB
儲存位置
此資料集會儲存在美國東部 2 的 Azure 區域。 為確保親和性,建議您將計算資源配置在美國東部 2。
資料存取
美國東部 2:'https://datasettcga.blob.core.windows.net/dataset'
使用條款
資料可供使用且不受限制。 如需詳細資訊及引文詳細資料,請參閱 TCGA 計畫頁面 (英文)
連絡人
若對 TCGA 資料和計畫有任何疑問:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact
下一步
檢視開放資料集目錄中的其餘資料集。