Dados abertos do TCGA
O Atlas do Genoma do Câncer (TCGA), um programa de genômica do câncer de referência, caracterizou molecularmente mais de 20.000 cânceres primários comparando-os a amostras normais, abrangendo 33 tipos de câncer[1]. Os dados sobre câncer do TCGA disponibilizados publicamente são duas camadas: acesso aberto ou controlado.
- Acesso aberto [disponível no Azure]: esse conjunto de dados contém dados clínicos e de espécimes desindentificados ou dados resumidos que não contêm nenhuma informação de identificação individual. Os tipos de dados incluídos são de expressão genética, valores beta de metilação e quantificação de proteína. O tipo de dados no nível de DNA inclui o número de cópia no nível do gene e o segmento de número de cópia mascarada.
- Acesso controlado: esse conjunto de dados é os dados de sequência de nível individual e requer aprovação por meio do dbGap para acesso.
Observação
A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.
Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.
Fonte de dados
Este conjunto de dados é um espelho dos dados abertos do TCGA
Volumes de dados e frequência de atualização
Ete conjunto de dados contém aproximadamente 387 GB
Local de armazenamento
Este conjunto de dados está armazenado nas regiões do Leste dos EUA 2 do Azure. É recomendável alocar recursos de computação na região Leste dos EUA 2 para fins de afinidade.
Acesso de dados
Leste dos EUA 2: "https://datasettcga.blob.core.windows.net/dataset"
Termos de uso
Os dados estão disponíveis sem restrições. Para obter mais informações e detalhes da citação, confira a página do programa TCGA
Contact
Para perguntas sobre dados e programa do TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact
Próximas etapas
Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.