共用方式為


TCGA 開放資料

The Cancer Genome Atlas (TCGA) 是一項劃時代的癌症基因體學計畫,對 20,000 多種原發性癌症進行了分子特徵分析,並比對了跨 33 種癌症類型的常態樣本[1]。 公開提供的 TCGA 癌症資料有兩層:開放存取或受控存取。

  • 開放存取 [適用於 Azure]:此資料集包含去身分識別的臨床和生物檢體資料,或不含任何個人識別資訊的摘要資料。 包含的資料類型包括基因表現、甲基化 Beta 值和蛋白質定量。 DNA 層級資料類型包括基因層級複製數 (Gene Level Copy Number) 和遮罩複製數片段 (Masked Copy Number Segment)。
  • 受控存取:此資料集是個別層級序列資料,需要透過 dbGap 核准才能存取。

注意

Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。

此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。

資料來源

此資料集真實地反映 TCGA 開放資料

資料量和更新頻率

此資料集包含大約 387 GB

儲存位置

此資料集會儲存在美國東部 2 的 Azure 區域。 為確保親和性,建議您將計算資源配置在美國東部 2。

資料存取

美國東部 2:'https://datasettcga.blob.core.windows.net/dataset'

使用條款

資料可供使用且不受限制。 如需詳細資訊及引文詳細資料,請參閱 TCGA 計畫頁面 (英文)

連絡人

若對 TCGA 資料和計畫有任何疑問:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

下一步

檢視開放資料集目錄中的其餘資料集。