TCGA Open Data
De Cancer Genome Atlas (TCGA), een landmark cancer genomics programma, moleculair gekenmerkt meer dan 20.000 primaire kanker en matched normale monsters die betrekking hebben op 33 kankertypen[1]. De TCGA-kankergegevens die openbaar beschikbaar worden gesteld, zijn twee lagen: open of gecontroleerde toegang.
- Open access [beschikbaar in Azure]: deze gegevensset bevat geïndentificeerde klinische en biospecimengegevens of samengevatte gegevens die geen afzonderlijk identificeerbare informatie bevatten. De opgenomen gegevenstypen zijn genexpressie, methylatie beta-waarden en eiwit kwantificatie. Het gegevenstype op DNA-niveau omvat het kopieernummer op genniveau en het gemaskeerde segment van het kopieernummer.
- Gecontroleerde toegang: Deze gegevensset is de gegevensreeksgegevens op individueel niveau en vereist goedkeuring via dbGap voor toegang.
Notitie
Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Gegevensbron
Deze gegevensset is een spiegel van TCGA Open Data
Gegevensvolumes en updatefrequentie
Deze gegevensset bevat ongeveer 387 GB
Opslaglocatie
Deze gegevensset wordt opgeslagen in de Azure-regio's VS - oost 2. Het wordt aanbevolen om rekenresources in US - oost 2 toe te wijzen voor affiniteit.
Toegang tot gegevens
VS - oost 2: 'https://datasettcga.blob.core.windows.net/dataset'
Gebruiksrechtovereenkomst
De gegevens zijn zonder beperkingen beschikbaar. Zie de tcga-programmapagina voor meer informatie en bronvermeldingen
Contactpersoon
Voor vragen over TCGA-gegevens en programma's: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.