1000 геномов
Проект по геномам 1000 был запущен в период с 2008 по 2015 год, чтобы создать крупнейший общедоступный каталог человеческих вариаций и данных генотипа. Окончательный набор данных содержит данные, полученные у 2504 лиц из 26 популяций, с 84 млн идентифицированных вариантов. Дополнительные сведения см. на веб-сайте проекта генома 1000 и следующих публикациях:
Дополнительные сведения о соответствующих форматах данных см . в этом ресурсе .
[NEW]: набор данных также доступен в формате parquet.
Примечание.
Корпорация Майкрософт предоставляет Открытые наборы данных Azure как есть. Корпорация Майкрософт не предоставляет никаких гарантий (явных или подразумеваемых) и не определяет никаких условий в связи с использованием этих наборов данных. В рамках, допускаемых местным законодательством, корпорация Майкрософт отказывается от ответственности за ущерб и убытки (в том числе прямые, косвенные, специальные, опосредованные, случайные и штрафные), понесенные в результате использования вами этих наборов данных.
Этот набор данных предоставляется на тех же условиях, на которых корпорация Майкрософт получила исходные данные. Этот набор может включать данные, полученные от корпорации Майкрософт.
Источник данных
Этот набор данных является зеркалом этого ресурса FTP.
Объемы данных и частота обновления
Этот набор данных содержит примерно 815 ТБ данных. Он получает ежедневные обновления.
Место хранения
Этот набор данных хранится в регионах Azure "Западная часть США 2" и "Центрально-западная часть США". Для обеспечения приближенности мы рекомендуем выделять вычислительные ресурсы в регионе "Западная часть США 2" или "Центрально-западная часть США".
Доступ к данным
Западная часть США 2:"https://dataset1000genomes.blob.core.windows.net/dataset"
Западная часть США: "https://dataset1000genomes-secondary.blob.core.windows.net/dataset"
Условия использования
После окончательных публикаций данные из проекта 1000 геномов общедоступны, без эмбарго, любому пользователю для использования в соответствии с условиями, предоставленными источником набора данных. Использование данных следует процитировать на подробные сведения, доступные в ресурсе 1000 геномных проектов и ответов.
Контакт
Прокрутите вниз по этому ресурсу для контактных данных.
Следующие шаги
Ознакомьтесь с другими наборами в каталоге Открытых наборов данных.