Что такое аналитика данных в режиме реального времени?
Аналитика данных в режиме реального времени обычно основана на приеме и обработке потока данных, состоящего из постоянного ряда данных, обычно связанных с конкретными событиями времени. Например, поток данных может содержать сведения о сообщениях, отправленных на сайт микро-блогов социальных сетей, или ряд измерений окружающей среды, записанных датчиком погоды, подключенным к Интернету.
Данные в потоке можно использовать для создания визуализаций данных в режиме реального времени для целей мониторинга или активации автоматических действий при возникновении определенных условий. Например, поток данных с датчика управления окружающей средой в офисном здании может обеспечить динамическое управление системами нагрева и кондиционирования воздуха для оптимизации комфорта и затрат. Данные также можно сохранять в хранилище данных и запрашивать позже, что позволяет аналитикам лучше понять изменения с течением времени. Например, маркетинговая организация может выполнять анализ тональности в сообщениях социальных медиа, чтобы узнать, приводит ли рекламная кампания к более положительным комментариям о компании или ее продуктах, или сельскохозяйственный бизнес может отслеживать тенденции температуры и осадков для оптимизации ирригации и сбора урожая.
Общие цели для аналитики в режиме реального времени включают в себя
- Непрерывный анализ данных для отчета о проблемах или тенденциях.
- Понимание поведения компонента или системы в различных условиях для планирования будущих улучшений.
- Активация определенных действий или оповещений при превышении определенных событий или пороговых значений.
Характеристики решений аналитики данных в режиме реального времени
Решения потоковой обработки для аналитики данных в режиме реального времени обычно демонстрируют следующие характеристики:
- Поток данных не связан . Данные добавляются в поток постоянно.
- Записи данных в потоке обычно включают временные (на основе времени) данные, указывающие, когда произошло событие, к которому связана запись (или была записана).
- Агрегирование потоковых данных часто выполняется по темпоральным окнам , например, записывая количество записей социальных сетей в минуту или среднее количество осадков в час.
- Результаты обработки потоковых данных можно использовать для поддержки автоматизации или визуализации в реальном времени (или почти в реальном времени) или сохранения в аналитическом хранилище для объединения с другими данными для исторического анализа. Многие решения объединяют эти подходы для поддержки аналитики в режиме реального времени и истории.
Возможности аналитики в режиме реального времени Microsoft Fabric позволяют реализовать решения аналитики в режиме реального времени, которые включают функции, описанные здесь с минимальными (или нет) усилиями по программированию и интеграцией с остальной частью экосистемы Microsoft Fabric.