Obter dados do Eventstream
Neste artigo, você aprenderá como obter dados de um fluxo de eventos existente em uma tabela nova ou existente.
Para obter dados de um novo fluxo de eventos, consulte Obter dados de um novo fluxo de eventos.
Pré-requisitos
- Um espaço de trabalho com uma capacidade de habilitada para Microsoft Fabric
- Um banco de dados KQL com permissões de edição
- Um fluxo de eventos com uma fonte de dados
Fonte
Para obter dados de um fluxo de eventos, você precisa selecionar o fluxo de eventos como sua fonte de dados. Você pode selecionar um fluxo de eventos existente das seguintes maneiras:
Na faixa inferior do seu banco de dados KQL, pode:
No menu suspenso Obter Dados e, em seguida, em Contínuo, selecione Eventstream>Existing Eventstream.
Selecione Obter dados e, em seguida, na janela Obter dados, selecione Eventstream.
No menu suspenso Obter dados, em contínuo , selecione Real-Time hub de dados>Fluxo de eventos existente.
Configurar
Selecione uma tabela de destino. Se pretender ingerir dados numa nova tabela, selecione + Nova tabela e introduza um nome de tabela.
Observação
Os nomes das tabelas podem ter até 1024 caracteres, incluindo espaços, alfanuméricos, hífenes e sublinhados. Não há suporte para caracteres especiais.
Em Configurar a fonte de dados, preencha as configurações usando as informações da tabela a seguir:
Configuração Descrição Espaço de trabalho O local do espaço de trabalho do fluxo de eventos. Selecione um espaço de trabalho na lista suspensa. Nome do fluxo de eventos O nome do seu fluxo de eventos. Selecione um fluxo de eventos na lista suspensa. Nome da conexão de dados O nome usado para fazer referência e gerenciar sua conexão de dados em seu espaço de trabalho. O nome da conexão de dados é preenchido automaticamente. Opcionalmente, você pode inserir um novo nome. O nome só pode conter caracteres alfanuméricos, traços e pontos e ter até 40 caracteres. Processar evento antes da ingestão no Eventstream Esta opção permite configurar o processamento de dados antes que os dados sejam ingeridos na tabela de destino. Se selecionado, você continua o processo de ingestão de dados no Eventstream. Para obter mais informações, consulte evento Process antes da ingestão no Eventstream. Filtros avançados Compressão Compactação de dados dos eventos, como provenientes do hub de eventos. As opções são Nenhum (padrão) ou Compactação Gzip. Propriedades do sistema de eventos Se houver vários registros por mensagem de evento, as propriedades do sistema serão adicionadas à primeira. Para obter mais informações, consulte Propriedades do sistema de eventos. Data de início da recuperação do evento A conexão de dados recupera eventos existentes criados desde a data de início da recuperação de eventos. Ele só pode recuperar eventos retidos pelo hub de eventos, com base em seu período de retenção. O fuso horário é UTC. Se nenhuma hora for especificada, a hora padrão será a hora em que a conexão de dados for criada. Selecione Próximo
Processar evento antes da ingestão no Eventstream
Antes da ingestão, a opção Process no Eventstream permite-lhe processar os dados antes de serem ingeridos na tabela de destino. Com esta opção, o processo de obter dados continua perfeitamente no Eventstream, com a tabela de destino e os detalhes da fonte de dados preenchidos automaticamente.
Para processar o evento antes da ingestão no Eventstream:
Na guia Configurar, selecione evento Processo antes da ingestão em Eventstream.
Na caixa de diálogo Processar eventos no Eventstream, selecione Continuar no Eventstream.
Importante
Selecionar Continuar no Eventstream encerra o processo de obtenção de dados no Real-Time Intelligence e continua no Eventstream com a tabela de destino e os detalhes da fonte de dados preenchidos automaticamente.
Em Eventstream, selecione o nó de destino Banco de Dados KQL e, no painel Banco de Dados KQL, verifique se Processamento de eventos antes da ingestão está selecionado e se os detalhes de destino estão corretos.
Selecione Abrir processador de eventos para configurar o processamento de dados e, em seguida, selecione Salvar. Para obter mais informações, consulte Processar dados de eventos com o editor do processador de eventos.
De volta ao painel Banco de Dados KQL, selecione Adicionar para concluir a configuração do nó de destino Banco de Dados KQL.
Verifique se os dados foram ingeridos na tabela de destino.
Observação
O evento processual anterior à ingestão no processo Eventstream está concluído, e as etapas restantes neste artigo não são necessárias.
Inspecionar
A guia Inspecionar é aberta com uma pré-visualização dos dados.
Para concluir o processo de ingestão, selecione Concluir.
Opcionalmente:
- Selecione visualizador de comandos para visualizar e copiar os comandos automáticos gerados a partir de suas entradas.
- Altere o formato de dados inferido automaticamente selecionando o formato desejado na lista suspensa. Os dados são lidos do Event Hub na forma de objetos EventData. Os formatos suportados são CSV, JSON, PSV, SCsv, SOHsv TSV, TXT e TSVE.
- Editar colunas.
- Explore opções avançadas com base no tipo de dados.
Editar colunas
Observação
- Para formatos tabulares (CSV, TSV, PSV), não é possível mapear uma coluna duas vezes. Para mapear para uma coluna existente, primeiro exclua a nova coluna.
- Não é possível alterar um tipo de coluna existente. Se você tentar mapear para uma coluna com um formato diferente, você pode acabar com colunas vazias.
As alterações que você pode fazer em uma tabela dependem dos seguintes parâmetros:
- Tipo de Tabela é do tipo novo ou existente
- O mapeamento do tipo é novo ou existente
Mapeando transformações
Alguns mapeamentos de formato de dados (Parquet, JSON e Avro) suportam transformações simples em tempo de ingestão. Para aplicar transformações de mapeamento, crie ou atualize uma coluna na janela Editar colunas.
As transformações de mapeamento podem ser executadas em uma coluna do tipo string ou datetime, com a fonte tendo o tipo de dados int ou long. As transformações de mapeamento suportadas são:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Opções avançadas com base no tipo de dados
Formatos Tabulares (CSV, TSV, PSV):
Os dados tabulares não incluem necessariamente os nomes das colunas usadas para mapear os dados de origem para as colunas existentes. Para usar a primeira linha como nomes de coluna, ative a opção Primeira linha é o cabeçalho da coluna.
JSON:
Para determinar a divisão de colunas dos dados JSON, selecione Níveis Avançados>Aninhados, de 1 a 100.
Resumo
Na janela de preparação de dados, todas as três etapas são marcadas com sinais de visto verdes quando a ingestão de dados é finalizada com sucesso. Você pode selecionar uma opção para consultar, eliminar os dados ingeridos ou ver um painel de resumo da sua ingestão. Selecione Fechar para fechar a janela.
Conteúdo relacionado
- Para gerenciar seu banco de dados, consulte Gerenciar dados
- Para criar, armazenar e exportar consultas, consulte Consultar dados em um conjunto de consultas KQL