Sdílet prostřednictvím


Příklad cen: Kopírování dat a jejich transformace pomocí Azure Databricks

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

V tomto scénáři chcete zkopírovat data z AWS S3 do služby Azure Blob Storage a transformovat je pomocí Azure Databricks podle hodinového plánu na 8 hodin denně po dobu 30 dnů.

Ceny použité v tomto příkladu jsou hypotetické a nejsou určeny k určení přesných skutečných cen. Náklady na čtení a zápis a monitorování se nezobrazují, protože jsou obvykle zanedbatelné a nemají významný vliv na celkové náklady. Spuštění aktivit se také zaokrouhlují na nejbližší 1000 v odhadech cenové kalkulačky.

Poznámka:

Tento odhad se týká jenom nákladů na Azure Data Factory. Azure Databricks bude v tomto scénáři také účtují náklady, které ale můžete odhadnout pomocí cenové kalkulačky Azure.

Podrobnější scénáře a odhad budoucích nákladů na používání služby najdete v cenové kalkulačce Azure.

Konfigurace

Pokud chcete tento scénář provést, musíte vytvořit kanál s následujícími položkami:

  • Jedna aktivita kopírování se vstupní datovou sadou, která se má zkopírovat z AWS S3, a výstupní datovou sadou pro data v úložišti Azure.
  • Jedna aktivita Azure Databricks pro transformaci dat
  • Jedna aktivační událost plánu pro spuštění kanálu každou hodinu. Když chcete spustit kanál, můžete ho aktivovat okamžitě nebo naplánovat. Kromě samotného kanálu se každá instance triggeru počítá jako jedno spuštění aktivity.

Diagram znázorňuje kanál s aktivační událostí plánu. V kanálu tok aktivity kopírování do vstupní datové sady, výstupní datové sady a aktivity DataBricks, která běží v Azure Databricks. Vstupní datová sada proudí do propojené služby AWS S3. Výstupní datová sada proudí do propojené služby Azure Storage.

Odhad nákladů

Operations Typy a jednotky
Spuštění kanálu 3 Spuštění aktivity na spuštění (1 pro spuštění triggeru, 2 pro spuštění aktivit) = 720 spuštění aktivit, zaokrouhleno nahoru, protože kalkulačka umožňuje pouze přírůstky 1 000.
Předpoklad kopírování dat: Hodiny DIU za spuštění = 10 min 10 min \ 60 min * 4 Azure Integration Runtime (výchozí nastavení DIU = 4) Další informace o jednotkách integrace dat a optimalizaci výkonu kopírování najdete v tomto článku.
Předpoklad aktivity Spuštění Databricks: hodiny externího spuštění za spuštění = 10 min 10 min \ 60 min provádění aktivity externího kanálu

Příklad cenové kalkulačky

Celková cena scénáře za 30 dní: 41,01 Kč

Snímek obrazovky s cenovou kalkulačkou nakonfigurovanou pro kopírování dat a transformaci pomocí scénáře Azure Databricks