共用方式為


編碼: DNA 元素的百科全書

DNA 元素的百科全書 (ENCODE) 聯盟是眾多研究團隊合力持續進行的國際共同作業,由國家人類基因組研究所 (NHGRI) 贊助。 ENCODE 的目標,是為人類基因組中的功能元素打造完整的組件清單,包括在蛋白質層級與 RNA 層級活動的元素,以及控制活躍基因中細胞與環境的調節元素。

ENCODE 調查員會採用各種不同的論文與方法識別功能元素。 基因元素的探索與註釋主要會透過定序各種不同的 RNA 來源、比較基因組、綜合生物資訊方法,以及人力彙整完成。 調節元素的調查通常會透過 DNA 高敏感檢測、DNA 甲基化檢測,以及與 DNA 及 RNA 互動之蛋白質 (即修飾組蛋白、轉錄因子、染色質調控蛋白及 RNA 結合蛋白) 的免疫沉澱法 (IP),並加以定序完成。

注意

Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。

此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。

資料來源

本資料集是 https://www.encodeproject.org/ 中資料存放區的鏡像

資料量和更新頻率

本資料集包含約 756 TB 的資料,且每天更新。

儲存位置

本資料集儲存於美國西部 2 及美國中西部 Azure 區域。 我們建議您在美國西部 2 或美國中西部配置計算資源,以確保同質性。

資料存取

美國西部 2:’https://datasetencode.blob.core.windows.net/dataset’

美國中西部:'https://datasetencode-secondary.blob.core.windows.net/dataset'

使用條款

外部資料使用者可以不受限制地自由下載、分析和發佈基於任何 ENCODE 資料的結果,無論其類型或大小如何,並且對於 ENCODE 資料產生者,無論是作為個人成員還是作為聯盟的一部分,都沒有寬限期。 針對使用未發佈 ENCODE 資料的研究員,我們建議與資料產生者連絡以討論可能的出版物。 聯盟會以獨立出版物的方式,持續發佈自身分析作業的結果。

針對在出版物及簡報中使用 ENCODE 資料集 (不論是否已發佈) 的研究員,ENCODE 要求以 https://www.encodeproject.org/help/citing-encode/ 中所述的方式註明出處為 ENCODE 聯盟。

連絡人

如果您有任何問題、疑慮或意見,歡迎傳送電子郵件至 encode-help@lists.stanford.edu 連絡我們的支援人員。

下一步

檢視開放資料集目錄中的其餘資料集。