TCGA Open Data
The Cancer Genome Atlas (TCGA), ein wegweisendes Krebsgenomprogramm, hat über 20 000 primäre Krebs- und dazu passende Normalproben aus 33 Krebsarten molekular charakterisiert[1]. Die TCGA-Krebsdaten, die öffentlich zur Verfügung gestellt werden, sind zweistufig: offener oder kontrollierter Zugriff.
- Offener Zugriff [in Azure verfügbar]: Dieses Dataset enthält von Identitätsmerkmalen bereinigte klinische Daten und Daten von Bioproben oder zusammengefasste Daten, die keine Personen identifizierende Informationen enthalten. Die enthaltenen Datentypen sind Genexpression, Methylierungsbetawerte und Proteinquantifizierung. Der Datentyp auf DNA-Ebene umfasst die Kopiernummer auf Genebene und das maskierte Kopiernummersegment.
- Kontrollierter Zugriff: Dieses Dataset enthält die Sequenzdaten auf individueller Ebene und erfordert die Genehmigung über dbGap für den Zugriff.
Hinweis
Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.
Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.
Datenquellen-
Dieses Dataset ist ein Spiegel von TCGA Open Data
Datenvolumes und Aktualisierungshäufigkeit
Dieses Dataset enthält ungefähr 387 GB
Speicherort
Dieses Dataset wird in den Azure-Regionen „USA, Osten 2“ gespeichert. Aus Gründen der Affinität wird die Zuweisung von Computeressourcen in der Region „USA, Osten 2“ empfohlen.
Datenzugriff
USA, Osten 2: „https://datasettcga.blob.core.windows.net/dataset“
Nutzungsbedingungen
Die Daten stehen uneingeschränkt zur Verfügung. Weitere Informationen und Details zu Zitaten finden Sie auf der TCGA-Programmseite
Contact
Bei Fragen zu TCGA-Daten und -Programmen: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact
Nächste Schritte
Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.