編碼: DNA 元素的百科全書
DNA 元素的百科全書 (ENCODE) 聯盟是眾多研究團隊合力持續進行的國際共同作業,由國家人類基因組研究所 (NHGRI) 贊助。 ENCODE 的目標,是為人類基因組中的功能元素打造完整的組件清單,包括在蛋白質層級與 RNA 層級活動的元素,以及控制活躍基因中細胞與環境的調節元素。
ENCODE 調查員會採用各種不同的論文與方法識別功能元素。 基因元素的探索與註釋主要會透過定序各種不同的 RNA 來源、比較基因組、綜合生物資訊方法,以及人力彙整完成。 調節元素的調查通常會透過 DNA 高敏感檢測、DNA 甲基化檢測,以及與 DNA 及 RNA 互動之蛋白質 (即修飾組蛋白、轉錄因子、染色質調控蛋白及 RNA 結合蛋白) 的免疫沉澱法 (IP),並加以定序完成。
注意
Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。
此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。
資料來源
本資料集是 https://www.encodeproject.org/ 中資料存放區的鏡像
資料量和更新頻率
本資料集包含約 756 TB 的資料,且每天更新。
儲存位置
本資料集儲存於美國西部 2 及美國中西部 Azure 區域。 我們建議您在美國西部 2 或美國中西部配置計算資源,以確保同質性。
資料存取
美國西部 2:’https://datasetencode.blob.core.windows.net/dataset’
美國中西部:'https://datasetencode-secondary.blob.core.windows.net/dataset'
使用條款
外部資料使用者可以不受限制地自由下載、分析和發佈基於任何 ENCODE 資料的結果,無論其類型或大小如何,並且對於 ENCODE 資料產生者,無論是作為個人成員還是作為聯盟的一部分,都沒有寬限期。 針對使用未發佈 ENCODE 資料的研究員,我們建議與資料產生者連絡以討論可能的出版物。 聯盟會以獨立出版物的方式,持續發佈自身分析作業的結果。
針對在出版物及簡報中使用 ENCODE 資料集 (不論是否已發佈) 的研究員,ENCODE 要求以 https://www.encodeproject.org/help/citing-encode/ 中所述的方式註明出處為 ENCODE 聯盟。
連絡人
如果您有任何問題、疑慮或意見,歡迎傳送電子郵件至 encode-help@lists.stanford.edu 連絡我們的支援人員。
下一步
檢視開放資料集目錄中的其餘資料集。