Udostępnij za pośrednictwem


Pakiet zasobów GATK

Pakiet zasobów GATK to kolekcja standardowych plików do pracy z danymi reekwencjonowania przez człowieka za pomocą zestawu GATK.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Źródło danych

Ten zestaw danych jest odzwierciedleniem magazynu danych w witrynie https://gatk.broadinstitute.org/hc/articles/360035890811-Resource-bundle

Woluminy danych i częstotliwość aktualizacji

  1. datasetgatkbestpractices: 542 GB
  2. datasetgatklegacybundles: 61 GB
  3. datasetgatktestdata: 2 TB
  4. datasetpublicbroadref: 477 GB
  5. datasetbroadpublic: 3 TB

Zestawy danych są aktualizowane w pierwszym tygodniu każdego miesiąca.

Lokalizacja usługi Storage

Ten zestaw danych jest przechowywany w regionach świadczenia platformy Azure: Zachodnie stany USA 2 i Zachodnio-środkowe stany USA. Zalecamy przydzielanie zasobów obliczeniowych w regionie Zachodnie stany USA 2 lub Zachodnio-środkowe stany USA z uwagi na koligację.

Dostęp do danych

  1. datasetgatkbestpractices

    Zachodnie stany USA 2: "https://datasetgatkbestpractices.blob.core.windows.net/dataset"

    Zachodnio-środkowe stany USA: "https://datasetgatkbestpractices-secondary.blob.core.windows.net/dataset"

  2. datasetgatklegacybundles

    Zachodnie stany USA 2: "https://datasetgatklegacybundles.blob.core.windows.net/dataset"

    Zachodnio-środkowe stany USA: "https://datasetgatklegacybundles-secondary.blob.core.windows.net/dataset"

  3. datasetgatktestdata

    Zachodnie stany USA 2: "https://datasetgatktestdata.blob.core.windows.net/dataset"

    Zachodnio-środkowe stany USA: "https://datasetgatktestdata-secondary.blob.core.windows.net/dataset"

  4. datasetpublicbroadref

    Zachodnie stany USA 2: "https://datasetpublicbroadref.blob.core.windows.net/dataset"

    Zachodnio-środkowe stany USA: "https://datasetpublicbroadref-secondary.blob.core.windows.net/dataset"

    Południowo-środkowe stany USA: "https://datasetpublicbroadrefsc.blob.core.windows.net/dataset"

  5. datasetbroadpublic

    Zachodnie stany USA 2: "https://datasetbroadpublic.blob.core.windows.net/dataset"

    Zachodnio-środkowe stany USA: "https://datasetbroadpublic-secondary.blob.core.windows.net/dataset"

    Południowo-środkowe stany USA: "https://datasetbroadpublicsc.blob.core.windows.net/dataset"

Warunki użytkowania

Odwiedź oficjalną witrynę pakietu zasobów GATK.

Kontakt biznesowy

Odwiedź oficjalną witrynę pakietu zasobów GATK.

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).