Анализ сценария и сопоставление его с параметром конфигурации HDInsight.
Прочтите приведенный ниже пример и ответьте на вопросы, чтобы подобрать для сценария конфигурацию кластера HDInsight.
Пример — велосипеды AdventureWorks
AdventureWorks продает велосипеды и запчасти к ним напрямую клиентам и распространителям. У компании в настоящее время есть один офис в Нидерландах. Они продают велосипеды клиентам в США, Германии и Испании по цепочке распространителей и через интернет-магазин. Выполнение доставки осуществляется через локальные распределительные центры.
Компания планирует расширить, создав новые офисы, так как рост продаж в этих странах или регионах увеличился за последние три года. Расположения:
- Токио, Япония
- Сиэтл, США
- Чикаго, США
- Берлин, Германия
- Барселона, Испания
- Париж, Франция
В течение последних 15 лет компания AdventureWorks работает на рынке с высокой конкуренцией. Они хотят стать самой инновационной велосипедной компанией, предоставляя текущим и будущим владельцам велосипедов лучшие в своем классе технологии и услуги. Отдел исследования и разработки в AdventureWorks придумал следующую волну инновационных продуктов. Они ожидают, что инженеры данных, инженеры по ИИ и специалисты по обработке и анализу данных помогут им в проектировании и реализации решения.
Учитывая повышенный уровень продаж и расширение в глобальном масштабе, существующая инфраструктура данных не будет соответствовать общим бизнес-требованиям или будущему росту, на который надеется AdventureWorks. Руководители по информационным технологиям хотят отказаться от существующих локальных систем и перейти в облако, чтобы поддержать ожидаемый рост. Этот план поддерживается финансовым директором, так как поступил запрос на замену оборудования в результате устаревания существующей инфраструктуры. Финансовый директор знает, что облако может предложить альтернативные, более экономичные варианты.
Как старший инженер данных вы будете помогать компании AdventureWorks в проектировании и реализации решения. Это поможет компании удовлетворить бизнес-требования, а также функциональные и технические требования для стратегий развития, расширения и внедрения инноваций. Этот план необходимо реализовать таким образом, чтобы можно было минимизировать эксплуатационные расходы и отслеживать эффективность.
На встрече по обсуждению потребностей вы узнаете о следующих требованиях:
Анализ данных
В настоящее время бизнес-отчеты предоставляются отдельной локальной базой данных, настроенной как хранилище данных. Она содержит базу данных с именем AdventureWorksDW, которая используется для создания отчетов за прошлые периоды и описательной аналитики. В последнее время этот сервер с трудом обрабатывает данные отчетов, поэтому ваша команда должна ограничить доступ к этим данным.
Кроме того, руководство компании AdventureWorks также хотело бы использовать анализ данных в дальнейшем наряду с возможностями прогнозной аналитики. В настоящее время эти операции не выполняются. Организация понимает, что можно создать подсистему анализа рекомендаций или текста. Они хотели бы разработать лучшую технологию и подход к реализации такого решения, которое также должно быть устойчивым и производительным.
Анализ социальных сетей
В последние годы отдел маркетинга в организации выполняет широкий спектр кампаний X в разное время года. Они хотят измерять влияние своей работы путем отслеживания активов в социальных сетях, таких как хэштеги, в ходе этих кампаний. Им нужна возможность отслеживать любой хэштег.
Подключенный велосипед
Велосипеды AdventureWorks могут быть оснащены инновационным встроенным компьютером. Этот компьютер состоит из автоматических функций блокировки велосипеда, а также отслеживает рабочее состояние. Компьютер собирает следующую информацию:
- Модель, серийный номер и зарегистрированный владелец велосипеда.
- Расположение велосипеда (долгота и широта).
- Текущее состояние (стоит, движется).
- Текущая скорость в километрах в час.
- Велосипед заблокирован/разблокирован.
- Сведения о частях и компонентах велосипеда (на электрических велосипедах)
Собственные и сторонние приложения могут получить доступ к информации о велосипедном компьютере, которая должна быть защищена. Эту информацию можно использовать для интеграции в мобильные приложения, отображения местоположения в реальном времени и получения сведений о велошеринге. Кроме того, ежедневные сводные данные можно сохранять в неструктурированные файлы. Эти данные включают в себя модель, серийный номер, зарегистрированного владельца, сводку по общему количеству километров за день и среднюю скорость.
Услуги по обслуживанию велосипедов
Существующие владельцы велосипедов могут подписаться на уведомления о том, когда велосипеду требуется ремонт, на основе следующих сведений:
- Данные телеметрии из электрического велосипеда на основе данных с датчиков.
- Сведения об использовании велосипеда, поступающие от встроенного велосипедного компьютера, на основе среднего пройденного расстояния и износа.
- Этот сценарий прогнозного обслуживания связан с услугой, на которую владельцы велосипедов могут подписаться за отдельную плату.
Ответы на вопросы
На основе приведенного ниже примера ответьте на следующие вопросы