Freigeben über


TCGA Open Data

The Cancer Genome Atlas (TCGA), ein wegweisendes Krebsgenomprogramm, hat über 20 000 primäre Krebs- und dazu passende Normalproben aus 33 Krebsarten molekular charakterisiert[1]. Die TCGA-Krebsdaten, die öffentlich zur Verfügung gestellt werden, sind zweistufig: offener oder kontrollierter Zugriff.

  • Offener Zugriff [in Azure verfügbar]: Dieses Dataset enthält von Identitätsmerkmalen bereinigte klinische Daten und Daten von Bioproben oder zusammengefasste Daten, die keine Personen identifizierende Informationen enthalten. Die enthaltenen Datentypen sind Genexpression, Methylierungsbetawerte und Proteinquantifizierung. Der Datentyp auf DNA-Ebene umfasst die Kopiernummer auf Genebene und das maskierte Kopiernummersegment.
  • Kontrollierter Zugriff: Dieses Dataset enthält die Sequenzdaten auf individueller Ebene und erfordert die Genehmigung über dbGap für den Zugriff.

Hinweis

Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.

Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.

Datenquellen-

Dieses Dataset ist ein Spiegel von TCGA Open Data

Datenvolumes und Aktualisierungshäufigkeit

Dieses Dataset enthält ungefähr 387 GB

Speicherort

Dieses Dataset wird in den Azure-Regionen „USA, Osten 2“ gespeichert. Aus Gründen der Affinität wird die Zuweisung von Computeressourcen in der Region „USA, Osten 2“ empfohlen.

Datenzugriff

USA, Osten 2: „https://datasettcga.blob.core.windows.net/dataset“

Nutzungsbedingungen

Die Daten stehen uneingeschränkt zur Verfügung. Weitere Informationen und Details zu Zitaten finden Sie auf der TCGA-Programmseite

Contact

Bei Fragen zu TCGA-Daten und -Programmen: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Nächste Schritte

Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.