Příklad cen: Kopírování dat a jejich transformace pomocí Azure Databricks
PLATÍ PRO: Azure Data Factory
Azure Synapse Analytics
Tip
Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.
V tomto scénáři chcete zkopírovat data z AWS S3 do služby Azure Blob Storage a transformovat je pomocí Azure Databricks podle hodinového plánu na 8 hodin denně po dobu 30 dnů.
Ceny použité v tomto příkladu jsou hypotetické a nejsou určeny k určení přesných skutečných cen. Náklady na čtení a zápis a monitorování se nezobrazují, protože jsou obvykle zanedbatelné a nemají významný vliv na celkové náklady. Spuštění aktivit se také zaokrouhlují na nejbližší 1000 v odhadech cenové kalkulačky.
Poznámka:
Tento odhad se týká jenom nákladů na Azure Data Factory. Azure Databricks bude v tomto scénáři také účtují náklady, které ale můžete odhadnout pomocí cenové kalkulačky Azure.
Podrobnější scénáře a odhad budoucích nákladů na používání služby najdete v cenové kalkulačce Azure.
Konfigurace
Pokud chcete tento scénář provést, musíte vytvořit kanál s následujícími položkami:
- Jedna aktivita kopírování se vstupní datovou sadou, která se má zkopírovat z AWS S3, a výstupní datovou sadou pro data v úložišti Azure.
- Jedna aktivita Azure Databricks pro transformaci dat
- Jedna aktivační událost plánu pro spuštění kanálu každou hodinu. Když chcete spustit kanál, můžete ho aktivovat okamžitě nebo naplánovat. Kromě samotného kanálu se každá instance triggeru počítá jako jedno spuštění aktivity.
Odhad nákladů
Operations | Typy a jednotky |
---|---|
Spuštění kanálu | 3 Spuštění aktivity na spuštění (1 pro spuštění triggeru, 2 pro spuštění aktivit) = 720 spuštění aktivit, zaokrouhleno nahoru, protože kalkulačka umožňuje pouze přírůstky 1 000. |
Předpoklad kopírování dat: Hodiny DIU za spuštění = 10 min | 10 min \ 60 min * 4 Azure Integration Runtime (výchozí nastavení DIU = 4) Další informace o jednotkách integrace dat a optimalizaci výkonu kopírování najdete v tomto článku. |
Předpoklad aktivity Spuštění Databricks: hodiny externího spuštění za spuštění = 10 min | 10 min \ 60 min provádění aktivity externího kanálu |
Příklad cenové kalkulačky
Celková cena scénáře za 30 dní: 41,01 Kč
Související obsah
- Příklad cen: Kopírování dat z AWS S3 do služby Azure Blob Storage po dobu 30 dnů
- Příklad cen: Kopírování dat a transformace s dynamickými parametry po dobu 30 dnů
- Příklad cen: Spouštění balíčků SSIS v prostředí Azure-SSIS Integration Runtime
- Příklad cen: Použití ladění toku dat mapování pro normální pracovní den
- Příklad cen: Transformace dat v úložišti objektů blob pomocí mapování toků dat
- Příklad cen: Integrace dat ve spravované virtuální síti Azure Data Factory
- Příklad cen: Získání rozdílových dat ze SAP ECC přes SAP CDC v mapování toků dat