Sdílet prostřednictvím


Otevřená data TCGA

The Cancer Genome Atlas (TCGA), orientační program rakoviny genomiky, molekulární charakterizuje více než 20 000 primární rakoviny a spároval normální vzorky zahrnující 33 typů rakoviny[1]. Data o rakovině TCGA zpřístupněná veřejně jsou dvě úrovně: otevřený nebo řízený přístup.

  • Otevřený přístup [k dispozici v Azure]: Tato datová sada obsahuje dendentifikovaná klinická a biospecimenová data nebo souhrnná data, která neobsahují žádné jednotlivě identifikovatelné informace. Zahrnuté datové typy jsou genový výraz, hodnoty methylace beta a kvantifikace proteinů. Datový typ úrovně DNA zahrnuje číslo kopírování na úrovni genu a maskovaný segment čísla kopírování.
  • Řízený přístup: Tato datová sada je data posloupnosti jednotlivých úrovní a vyžaduje schválení prostřednictvím dbGap pro přístup.

Poznámka:

Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Zdroj dat

Tato datová sada je zrcadlem TCGA Open Data.

Objemy dat a frekvence aktualizací

Tato datová sada obsahuje přibližně 387 GB.

Dočasné úložiště

Tato datová sada je uložená v oblastech Azure USA – východ 2. Kvůli přidružení se doporučuje přidělovat výpočetní prostředky v oblasti USA – východ 2.

Přístup k datům

USA – východ 2: 'https://datasettcga.blob.core.windows.net/dataset'

Podmínky použití

Data jsou k dispozici bez omezení. Další informace a podrobnosti citace naleznete na stránce programu TCGA.

Kontakt

Dotazy týkající se dat a programu TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Další kroky

Prohlédněte si zbývající datové sady v katalogu Open Datasets.