Explorar a análise de dados
A análise de dados está relacionada com a examinação, a transformação e a ordenação de dados para que os possa estudar e extrair informações úteis. A análise de dados é uma disciplina que abrange toda a gama de tarefas de gestão de dados. Estas tarefas incluem não só a análise, como também a recolha de dados, a organização, o armazenamento e todas as ferramentas e técnicas utilizadas.
O termo análise de dados é um termo global que abrange várias atividades, cada uma com o seu próprio foco e objetivos. Pode categorizar estas atividades como análises descritivas, de diagnóstico, preditivas, prescritivas e cognitivas.
Nesta unidade, vai ficar a conhecer estas categorias de análise de dados.
Análise descritiva
A análise descritiva ajuda a responder a perguntas sobre o que aconteceu com base em dados históricos. As técnicas de análise descritiva resumem grandes conjuntos de dados para descrever os resultados aos intervenientes.
Ao desenvolverem KPIs (Indicadores Chave de Desempenho), estas estratégias podem ajudar a controlar o êxito ou o fracasso de objetivos-chave. Em muitas indústrias, são utilizadas métricas, como o retorno do investimento (ROI). As métricas especializadas são desenvolvidas para controlar o desempenho em indústrias específicas.
Entre os exemplos de análise descritiva incluem-se a geração de relatórios para proporcionar uma vista dos dados financeiros e das vendas de uma organização.
Análise de diagnóstico
A análise de diagnóstico ajuda a responder a perguntas sobre o motivo pelo qual algo aconteceu. As técnicas de análise de diagnóstico complementam análises descritivas mais básicas. Baseiam-se nos resultados da análise descritiva e fazem análises mais detalhadas para encontrar a causa. Os indicadores de desempenho são investigados mais pormenorizadamente para descobrir o motivo pelo qual melhoraram ou pioraram. Isto geralmente ocorre em três passos:
- Identificar anomalias nos dados. Estas podem ser alterações inesperadas numa métrica ou num determinado mercado.
- Recolher dados relacionados com estas anomalias.
- Utilizar técnicas estatísticas para descobrir relações e tendências que expliquem estas anomalias.
Análise preditiva
A análise preditiva ajuda a responder a perguntas sobre o que vai acontecer no futuro. As técnicas de análise preditiva utilizam dados históricos para identificar tendências e determinar a sua probabilidade de recorrência. As ferramentas de analise preditiva fornecem informações valiosas sobre o que pode acontecer no futuro. Entre as técnicas encontra-se uma variedade de técnicas de aprendizagem automática e aprendizagem estatística, tais como redes neurais, árvores de decisões e regressão.
Análise prescritiva
A análise prescritiva ajuda a responder a perguntas sobre as medidas que devem ser tomadas para alcançar um objetivo ou alvo. Ao utilizar informações da análise preditiva, podem ser tomadas decisões condicionadas por dados. Esta técnica permite que as empresas tomem decisões informadas face à incerteza. As técnicas de análise prescritiva dependem de estratégias de aprendizagem automática para encontrar padrões em grandes conjuntos de dados. Através da análise de decisões e eventos anteriores, pode estimar-se a probabilidade de se obterem resultados diferentes.
Análise cognitiva
A análise cognitiva tenta extrair inferências dos dados e padrões existentes, retirar conclusões baseadas em bases de dados de conhecimento existentes e, depois, voltar a adicionar estas descobertas à base de dados de conhecimento para futuras inferências. Trata-se de um ciclo de feedback de autoaprendizagem. A análise cognitiva ajuda-o a ficar a saber o que pode acontecer se as circunstâncias mudarem e a forma como pode lidar com estas situações.
As inferências não são consultas estruturadas baseadas numa base de dados de regras. São hipóteses não estruturadas recolhidas de várias origens e expressas com níveis de confiança variáveis. A análise cognitiva eficaz depende de algoritmos de aprendizagem automática. Utiliza vários conceitos de NLP (Processamento de Linguagem Natural) para dar sentido a origens de dados anteriormente não exploradas, tais como registos de conversações de call center e avaliações de produtos.
Teoricamente, ao tirar partido dos benefícios da computação paralela/distribuída em massa e da descida dos custos de armazenamento de dados e capacidade de computação, o nível de desenvolvimento que estes sistemas conseguem alcançar não tem limite.