ENCODE: Enciclopédia de Elementos de DNA
O Consórcio da Enciclopédia dos Elementos de DNA (ENCODE) é uma colaboração internacional contínua de grupos de pesquisa financiados pelo Instituto Nacional de Pesquisa do Genoma Humano (NHGRI). O objetivo do ENCODE é construir uma lista abrangente de elementos funcionais no genoma humano, incluindo elementos que atuam nos níveis de proteína e RNA, e elementos reguladores que controlam as células e as circunstâncias em que um gene está ativo.
Os investigadores ENCODE empregam vários ensaios e métodos para identificar elementos funcionais. A descoberta e anotação dos elementos genéticos é conseguida principalmente através da sequenciação de diferentes origens de ARN, genómica comparativa, métodos de bioinformática integrativa e organização humana. Os elementos reguladores são tipicamente investigados através de ensaios de hipersensibilidade ao DNA, ensaios de metilação do DNA e imunoprecipitação (IP) de proteínas que interagem com DNA e RNA, ou seja, histonas modificadas, fatores de transcrição, reguladores da cromatina e proteínas de ligação ao RNA, seguidos de sequenciamento.
Nota
A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.
Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.
Data source
Este conjunto de dados é um espelho do arquivo de dados em https://www.encodeproject.org/
Volumes de dados e frequência de atualização
Esse conjunto de dados inclui aproximadamente 756 TB de dados e é atualizado diariamente.
Localização de armazenamento
Este conjunto de dados está armazenado nas regiões E.U.A. Oeste 2 e E.U.A. Centro-Oeste do Azure. Recomendamos localizar recursos de computação no Oeste dos EUA 2 ou no Centro-Oeste dos EUA por afinidade.
Acesso a Dados
Oeste dos EUA 2: 'https://datasetencode.blob.core.windows.net/dataset'
Centro-Oeste dos EUA: 'https://datasetencode-secondary.blob.core.windows.net/dataset'
Termos de Utilização
Os usuários de dados externos podem baixar, analisar e publicar livremente os resultados com base em quaisquer dados ENCODE sem restrições, independentemente do tipo ou tamanho, e não inclui nenhum período de carência para os produtores de dados ENCODE, seja como membros individuais ou como parte do Consórcio. Os investigadores que utilizem dados ENCODE não publicados são incentivados a contactar os produtores de dados para discutir possíveis publicações. O Consortium irá continuar a publicar os resultados dos seus próprios esforços de análise em publicações independentes.
O ENCODE pede aos investigadores que utilizarem os conjuntos de dados (publicados ou não publicados) do ENCODE em publicações e apresentações que citem o ENCODE Consortium através dos métodos descritos em https://www.encodeproject.org/help/citing-encode/.
Contacto
Se você tiver dúvidas, preocupações ou comentários, envie um e-mail para o nosso suporte técnico em encode-help@lists.stanford.edu.
Próximos passos
Exiba o restante dos conjuntos de dados no catálogo Open Datasets.