Usar o Azure Synapse Analytics com análise em escala de nuvem
O Azure Synapse Analytics é o serviço de análise provisionado e integrado que acelera o tempo de análise entre data warehouses e sistemas de Big Data. O Azure Synapse Analytics reúne:
- As melhores tecnologias SQL usadas no armazenamento de dados corporativos.
- Tecnologias do Spark usadas para Big Data.
- Pipelines para aplicativo de dados (alinhado à origem) e ETL (extração, transformação e carregamento) ou ELT (extração, carregamento e transformação).
O Azure Synapse Studio é uma ferramenta no Azure Synapse que fornece uma experiência unificada para gerenciamento, monitoramento, codificação e segurança. O Synapse Studio tem profunda integração com outros serviços do Azure, como Power BI, Azure Cosmos DB e Azure Machine Learning.
Nota
Esta seção tem como objetivo descrever as configurações prescritas que são específicas para análise em escala de nuvem. Ela é um complemento da documentação oficial do Azure Synapse Analytics.
Visão geral
Durante a configuração inicial de uma zona de destino de dados , você pode implantar um único workspace do Azure Synapse Analytics para uso por todos os analistas e cientistas de dados. Você pode criar mais workspaces para integrações de dados específicas ou produtos de dados.
Talvez você precise de workspaces do Azure Synapse Analytics adicionais se o produto de dados precisar fornecer acesso a dados padronizados com segurança em nível de linha e de coluna. Você pode fornecer esses workspaces com pools do Azure Synapse. As equipes de produtos de dados podem precisar de seu próprio espaço de trabalho para criar produtos de dados e de um espaço de trabalho separado, exclusivo para estas equipes, com acesso de desenvolvimento delimitado.
Configuração do Azure Synapse Analytics
A primeira etapa na implantação do Azure Synapse Analytics é configurar um espaço de trabalho do Azure Synapse que está conectado a uma conta do Microsoft Purview.
Rede do Azure Synapse Analytics
Uma zona de destino de dados cria workspaces com uma Rede virtual gerenciada do Azure Synapse Analytics. A comunicação com o Azure Synapse ocorre por meio dos três endpoints que ele expõe: pool de SQL, SQL sob demanda e o endpoint de desenvolvimento.
No nível de rede, a análise de escala de nível usa pontos de extremidade privados gerenciados pelo Synapse. Esses pontos de extremidade garantem que todo o tráfego entre a rede virtual da zona de destino de dados e os workspaces do Azure Synapse se movimente inteiramente pela rede de backbone da Microsoft.
Controle de acesso a dados do Azure Synapse
Use listas de controle de acesso com Passagem do Microsoft Entra no Azure Synapse Analytics para gerenciar o acesso aos arquivos no data lake.
Para dados em que você precisa restringir colunas e linhas retornadas, recomendamos a segurança em nível de linha e de coluna para restringir o acesso a dados nas tabelas no pool dedicado ou sem servidor do SQL do Azure Synapse. A segurança em nível de linha e a segurança em nível de coluna são implementadas no nível do banco de dados e além das funções de banco de dados.
Por exemplo, a segurança em nível de linha garante que os usuários em um aplicativo de dados específico (alinhado à origem) ou produto de dados vejam apenas seus próprios dados. Mesmo que a tabela contenha dados para toda a empresa.
Você pode combinar a segurança em nível de linha com a segurança em nível de coluna para restringir o acesso a colunas com dados confidenciais. Dessa forma, a segurança em nível de linha e a segurança em nível de coluna aplicam a lógica de restrição de acesso na camada de banco de dados em vez da camada de aplicativo. A permissão é avaliada sempre que o acesso a dados é tentado de qualquer camada.
Nota
O pool de SQL sem servidor do Azure Synapse dá suporte a segurança em nível de coluna para exibições e não para tabelas externas. No caso de tabelas externas, é possível criar uma exibição lógica na parte superior da tabela externa e aplicar a segurança em nível de coluna. No caso da segurança em nível de linha, as exibições personalizadas podem ser usadas como uma solução alternativa.
Para saber mais, confira Controle de acesso a dados do Azure Synapse Analytics.
Controle de acesso a dados do Azure Synapse no Azure Data Lake
Ao implantar um espaço de trabalho do Azure Synapse Analytics, você precisa de uma conta do Azure Data Lake Storage da assinatura ou pode usar manualmente a URL da conta de armazenamento. A conta de armazenamento especificada é definida como primária para o workspace do Azure Synapse implantado para armazenar os dados. O Azure Synapse armazena dados em um contêiner que inclui tabelas do Apache Spark e logs de aplicativos Spark em uma pasta chamada /synapse/{workspaceName}
. Ele também tem um contêiner para gerenciar todas as bibliotecas que você optar por instalar.
Dica
É recomendável usar um contêiner dedicado na conta de camada de desenvolvimento ou data lake três. Esse contêiner é usado como armazenamento primário para armazenar metadados do Spark.
Confira o Controle de acesso a dados do Azure Synapse Analytics para obter recomendações sobre como configurar o acesso a dados.