Dela via


1000 Genomes

Genomes-projektet 1000 kördes mellan 2008 och 2015 för att skapa den största offentliga katalogen med mänsklig variation och genotypdata. Den slutliga datauppsättningen innehåller data för 2 504 individer från 26 populationer och 84 miljoner identifierade varianter. Mer information finns på 1000 Genome Project-webbplatsen och dessa publikationer:

Pilotanalys: En karta över människans genomvariant från sekvensering i befolkningsskala Nature 467, 1061-1073 (28 oktober 2010)

Fas 1-analys: En integrerad karta över genetisk variation från 1 092 mänskliga genom Nature 491, 56-65 (01 november 2012)

Fas 3-analys: En global referens för mänsklig genetisk variation Nature 526, 68-74 (01 oktober 2015) och En integrerad karta över strukturell variation i 2 504 mänskliga genom Nature 526, 75-81

Besök den här resursen för mer information om relevanta dataformat.

[NY]: Datamängden är också tillgänglig i parquet-format.

Kommentar

Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.

Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.

Data source

Den här datamängden är en spegling av den här FTP-resursen.

Datavolymer och uppdateringsfrekvens

Den här datamängden innehåller cirka 815 TB data. Den får dagliga uppdateringar.

Lagringsplats

Den här datamängden lagras i Azure-regionerna USA, västra 2 och USA, västra centrala. Vi rekommenderar att du letar upp beräkningsresurser i USA, västra 2 eller USA, västra centrala för tillhörighet.

Dataåtkomst

USA, västra 2:"https://dataset1000genomes.blob.core.windows.net/dataset'"

USA, västra centrala: "https://dataset1000genomes-secondary.blob.core.windows.net/dataset"

Användningsvillkor

Efter de slutliga publikationerna är data från 1000 Genomes-projektet offentligt tillgängliga, utan embargo, för alla för användning enligt de villkor som tillhandahålls av datamängdskällan. Användning av data bör anges enligt information som är tillgänglig i resursen 1000 Genome Project FAQ.

Kontakt

Rulla nedåt på den här resursen för kontaktinformationen.

Nästa steg

Visa resten av datauppsättningarna i katalogen Öppna datamängder.