Důležité informace o místní bráně dat pro cíle dat v Toku dat Gen2
Tento článek se snaží uvést omezení a aspekty při používání brány dat se scénáři cílů dat v Toku dat Gen2.
Vypršení časového limitu vyhodnocení
Toky dat, které používají bránu a cílovou funkci dat, jsou omezené na dobu vyhodnocení nebo aktualizace jedné hodiny.
Další informace o tomto omezení najdete v článku Řešení potíží s místní bránou dat.
Problémy se sítí s portem 1433
Při použití Microsoft Fabric Dataflow Gen2 s místní bránou dat můžete narazit na problémy s procesem aktualizace toku dat. K základnímu problému dochází v případě, že se brána nemůže připojit k pracovnímu toku dat Lakehouse, aby před zkopírováním dat do požadovaného cíle dat přečetla data. K tomuto problému může dojít bez ohledu na typ používaného cíle dat.
Během celkové aktualizace toku dat se aktualizace tabulek může zobrazit jako Úspěch, ale část aktivit se zobrazuje jako Neúspěšná. Podrobnosti o chybě pro aktivitu WriteToDatabaseTableFrom_...
označují následující chybu:
Mashup Exception Error: Couldn't refresh the entity because of an issue with the mashup document MashupException.Error: Microsoft SQL: A network-related or instance-specific error occurred while establishing a connection to SQL Server. The server was not found or was not accessible. Verify that the instance name is correct and that SQL Server is configured to allow remote connections. (provider: TCP Provider, error: 0 - An attempt was made to access a socket in a way forbidden by its access permissions.) Details: DataSourceKind = Lakehouse;DataSourcePath = Lakehouse;Message = A network-related or instance-specific error occurred while establishing a connection to SQL Server. The server was not found or was not accessible. Verify that the instance name is correct and that SQL Server is configured to allow remote connections. (provider: TCP Provider, error: 0 - An attempt was made to access a socket in a way forbidden by its access permissions.);ErrorCode = -2146232060;Number = 10013
Poznámka:
Z hlediska architektury modul toku dat používá k zápisu dat do Lakehouse odchozí koncový bod HTTPS (port 443). Čtení dat z Lakehouse však vyžaduje použití protokolu TDS (TCP přes port 1433). Tento protokol se využívá ke kopírování dat z přípravného jezera do cíle dat. To vysvětluje, proč krok Načtení tabulek proběhne úspěšně, zatímco cílová aktivita dat selže, i když jsou obě objekty lakehouse ve stejné instanci OneLake.
Řešení problému
Pokud chcete tento problém vyřešit, postupujte následovně:
Ověřte, že je tok dat nakonfigurovaný s cílem dat.
Ověřte, že aktualizace toku dat selže a že se aktualizace tabulek zobrazuje jako Úspěch a aktivity se zobrazují jako Neúspěšné.
Projděte si podrobnosti o chybě pro aktivitu
WriteToDatabaseTableFrom_...
, která poskytuje informace o zjištěné chybě.
Řešení: Nastavení nových pravidel brány firewall na serveru se spuštěnou bránou
Pravidla brány firewall na serveru brány nebo proxy serverech zákazníka je potřeba aktualizovat, aby umožňovala odchozí provoz ze serveru brány do následujících koncových bodů. Pokud brána firewall nepodporuje zástupné znamény, použijte IP adresy z rozsahů IP adres Azure a značek služeb. Každý měsíc je potřeba je udržovat v synchronizaci.
- Protokol: TCP
- Koncové body: *.datawarehouse.pbidedicated.windows.net, *.datawarehouse.fabric.microsoft.com, *.dfs.fabric.microsoft.com
- Port: 1433
Poznámka:
V určitých scénářích, zejména v případě, že je kapacita umístěná v oblasti, která není nejblíže bráně Gateway, může být nutné nakonfigurovat bránu firewall tak, aby umožňovala přístup k více koncovým bodům (*cloudapp.azure.com). Tato úprava je nutná k přizpůsobení přesměrování, ke kterým může dojít za těchto podmínek. Pokud se provoz směrovaný na *.cloudapp.azure.com pravidlo nezachytí, můžete případně povolit IP adresy pro vaši oblast dat v bráně firewall.
Pokud chcete zúžit rozsah koncového bodu na skutečnou instanci OneLake v pracovním prostoru (místo zástupného znaku *.datawarehouse.pbidedicated.windows.net), najdete tuto adresu URL tak, že přejdete do pracovního prostoru Prostředky infrastruktury, najdete DataflowsStagingLakehouse
ho a vyberete Zobrazit podrobnosti. Potom zkopírujte a vložte připojovací řetězec SQL.
Celý název koncového bodu vypadá podobně jako v následujícím příkladu:
x6eps4xrq2xudenlfv6naeo3i4-l27nd6wdk4oephe4gz4j7mdzka.datawarehouse.pbidedicated.windows.net
Alternativní řešení: Rozdělení toku dat do samostatného ingestování a načtení toku dat
Pokud nemůžete aktualizovat pravidla brány firewall, můžete tok dat rozdělit do dvou samostatných toků dat. První tok dat zodpovídá za ingestování dat do přípravného jezera. Druhý tok dat je zodpovědný za načtení dat z přípravného jezera do cíle dat. Toto alternativní řešení není ideální, protože vyžaduje použití dvou samostatných toků dat, ale dá se použít jako dočasné řešení, dokud nebude možné aktualizovat pravidla brány firewall.
Pokud chcete implementovat toto alternativní řešení, postupujte takto:
Odeberte cíl dat z aktuálního toku dat, který ingestuje data přes bránu.
Vytvořte nový tok dat, který používá konektor toku dat k připojení k ingestovanému toku dat. Tento tok dat zodpovídá za ingestování dat z přípravného do cíle dat.
Nastavte cíl dat tak, aby byl cílem dat podle vašeho výběru pro tento nový tok dat.
Volitelně můžete pro tento nový tok dat zakázat přípravu. Tato změna zabrání opětovnému zkopírování dat do staging lakehouse a místo toho zkopíruje data přímo z ingestovaného datového toku do cílového umístění dat.