千人基因組
在 2008 年到 2015 年之間執行的千人基因組計劃,為人類變異與基因型資料建立最大型的公開目錄。 完整資料集包含了來自 26 個國家/地區人口的 2,504 筆個人資料,以及 8,400 萬種已識別的變異。 如需進一步了解,請造訪千人基因組專案網站與下列出版品:
試驗分析:人口規模定序產生的人類基因組變異圖譜,Nature 467,1061-1073 (2010 年 10 月 28 日)
第 1 階段分析:1,092 人人類基因組的基因變異整合圖譜,Nature 491,56-65 (2012 年 11 月 1 日)
第 3 階段分析:人類基因變異的全球參考,Nature 526,68-74 (2015 年 10 月 1 日),和 2,504 人人類基因的結構變異整合圖譜,Nature 526,75-81
如需相關資料格式的詳細資訊,請瀏覽此資源。
[新增]:此資料集也提供 parquet 格式。
注意
Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。
此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。
資料來源
此資料集是這個 FTP 資源的鏡像。
資料量和更新頻率
此資料集包含大約 815 TB 的資料。 此資料集會每日更新。
儲存位置
本資料集儲存於美國西部 2 及美國中西部 Azure 區域。 我們建議您在美國西部 2 或美國中西部配置計算資源,以確保同質性。
資料存取
美國西部 2:“'https://dataset1000genomes.blob.core.windows.net/dataset”
美國中西部:“https://dataset1000genomes-secondary.blob.core.windows.net/dataset"
使用條款
在最後的出版品發佈後,千人基因組專案的資料立即公開,任何人皆可遵循資料集來源所提供的條款來使用資料。 應根據千人基因組專案常見問題資源中提供的詳細資料來引用資料。
連絡人
請在此資源向下捲動以取得連絡資訊。
下一步
檢視開放資料集目錄中的其餘資料集。