Otwarte dane TCGA
Cancer Genome Atlas (TCGA), przełomowy program genomiki raka, molekularnie scharakteryzował ponad 20.000 podstawowych nowotworów i dopasowane normalne próbki obejmujące 33 typy nowotworów[1]. Dane dotyczące raka TCGA udostępniane publicznie są dwie warstwy: otwarty lub kontrolowany dostęp.
- Otwarty dostęp [dostępny na platformie Azure]: ten zestaw danych zawiera zdeindentyfikowane dane kliniczne i biospecimen lub podsumowane dane, które nie zawierają żadnych indywidualnie możliwych do zidentyfikowania informacji. Uwzględnione typy danych to wyrażenia genów, wartości beta metylacji i kwantyfikacji białka. Typ danych na poziomie DNA obejmuje numer kopii na poziomie genu i zamaskowany segment numerów kopii.
- Kontrolowany dostęp: ten zestaw danych to dane sekwencji poszczególnych poziomów i wymaga zatwierdzenia za pośrednictwem dbGap w celu uzyskania dostępu.
Uwaga
Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.
Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.
Źródło danych
Ten zestaw danych jest dublowaniem danych open data TCGA
Woluminy danych i częstotliwość aktualizacji
Ten zestaw danych zawiera około 387 GB
Lokalizacja usługi Storage
Ten zestaw danych jest przechowywany w regionach świadczenia usługi Azure Wschodnie stany USA 2. Zalecamy przydzielanie zasobów obliczeniowych w regionie Wschodnie stany USA 2 z uwagi na koligację.
Dostęp do danych
Wschodnie stany USA 2: "https://datasettcga.blob.core.windows.net/dataset"
Warunki użytkowania
Dane są dostępne bez ograniczeń. Aby uzyskać więcej informacji i szczegółów cytatu, zobacz stronę programu TCGA
Kontakt biznesowy
W przypadku pytań dotyczących danych i programu TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact
Następne kroki
Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).