Доступ к журналам диагностики Azure Data Lake Storage 1-го поколения
Узнайте, как включить ведение журнала диагностики для учетной записи Azure Data Lake Storage 1-го поколения и просматривать журналы, собранные для этой учетной записи.
Организации могут включить ведение журнала диагностики для своей учетной записи Azure Data Lake Storage 1-го поколения для сбора журналов аудита доступа к данным, которые предоставляют такую информацию, как список пользователей, имеющих доступ к данным, частоту сеансов доступа к данным, объем данных, хранящихся в учетной записи и пр. Когда ведение журнала включено, диагностика и/или запросы регистрируются в максимально возможном объеме. Записи запросов и диагностики журнала создаются только при получении запроса к конечной точке службы.
Предварительные требования
- Подписка Azure. См. страницу бесплатной пробной версии Azure.
- Учетная запись Azure Data Lake Storage 1-го поколения. Следуйте инструкциям из статьи Начало работы с Azure Data Lake Storage Gen1 с помощью портала Azure.
Включение ведения журнала диагностики для учетной записи Data Lake Storage 1-го поколения
Войдите на новый портал Azure.
Откройте свою учетную запись Data Lake Storage 1-го поколения. В колонке учетной записи Data Lake Storage 1-го поколения щелкните Параметры диагностики.
В колонке Параметры диагностики выберите Включить диагностику.
В колонке Параметры диагностики внесите следующие изменения, чтобы настроить ведение журнала диагностики.
В поле Имя введите значение конфигурации журнала диагностики.
Хранить и обрабатывать данные можно разными способами.
Выберите параметр Archive to a storage account (Архивация в учетную запись хранения), чтобы сохранять журналы в учетную запись хранения Azure. Используйте этот параметр, если вы хотите архивировать данные для последующей пакетной обработки. Если выбран этот параметр, то необходимо указать учетную запись хранения Azure для сохранения журналов.
Выберите параметр Stream to an event hub (Потоковая передача в концентратор событий), чтобы передавать поток данных журнала в концентратор событий Azure. Чаще всего этот параметр используется, если имеется конвейер последующей обработки для анализа входящих журналов в режиме реального времени. При выборе этого параметра необходимо указать сведения о концентраторе событий Azure, который вы хотите использовать.
Выберите параметр Отправить в Log Analytics, чтобы использовать службу Azure Monitor для анализа созданных данных журнала. При выборе этого параметра необходимо указать сведения для рабочей области Log Analytics, которая будет использоваться для анализа журнала. Дополнительные сведения об использовании журналов Azure Monitor см. в статье Просмотр или анализ данных, собранных с помощью поиска журналов Azure Monitor.
Укажите, что вы хотите получать: журналы аудита, журналы запросов либо и те, и другие журналы.
Укажите число дней, в течение которых должны храниться данные. Период удержания применяется, только если учетная запись хранения Azure используется для архивации данных журнала.
Нажмите Сохранить.
Включив параметры диагностики, вы сможете просматривать журналы на вкладке Журналы диагностики .
Просмотр журналов диагностики для учетной записи Data Lake Storage 1-го поколения
Существует два способа просмотра данных журнала для учетной записи Data Lake Storage 1-го поколения:
- из представления параметров учетной записи Data Lake Storage 1-го поколения;
- из учетной записи хранения Azure, в которой хранятся данные.
Использование представления параметров Data Lake Storage 1-го поколения
В колонке Параметры учетной записи Data Lake Storage 1-го поколения щелкните Журналы диагностики.
В колонке Журналы диагностики должны отображаться журналы, упорядоченные по категориям Журналы аудита и Журналы запросов.
- В журналы запросов записываются все запросы API к учетной записи Data Lake Storage 1-го поколения.
- Журналы аудита похожи на журналы запросов, но содержат более подробную статистику операций с учетной записью Data Lake Storage 1-го поколения. Например, вызов API для одной передачи в журналах запросов может породить несколько операций добавления в журналах аудита.
Щелкните ссылку Скачать для каждой записи журнала, чтобы скачать журналы.
Использование учетной записи хранения Azure, в которой хранятся данные
Откройте колонку учетной записи хранения Azure, связанную с Data Lake Storage 1-го поколения для ведения журнала, и щелкните "BLOB-объекты". В колонке Служба BLOB-объектов отображается два контейнера.
- В контейнере insights-logs-audit содержатся журналы аудита.
- В контейнере insights-logs-requests содержатся журналы запросов.
Журналы в этих контейнерах хранятся с использованием следующей структуры:
Например, полный путь к журналу аудита может выглядеть таким образом:
https://adllogs.blob.core.windows.net/insights-logs-audit/resourceId=/SUBSCRIPTIONS/<sub-id>/RESOURCEGROUPS/myresourcegroup/PROVIDERS/MICROSOFT.DATALAKESTORE/ACCOUNTS/mydatalakestorage/y=2016/m=07/d=18/h=04/m=00/PT1H.json
Аналогично, полный путь к журналу запросов может выглядеть так
https://adllogs.blob.core.windows.net/insights-logs-requests/resourceId=/SUBSCRIPTIONS/<sub-id>/RESOURCEGROUPS/myresourcegroup/PROVIDERS/MICROSOFT.DATALAKESTORE/ACCOUNTS/mydatalakestorage/y=2016/m=07/d=18/h=14/m=00/PT1H.json
Описание структуры данных журнала
В журналах аудита и запросов используется формат JSON. В этом разделе мы рассмотрим структуру JSON для журналов запросов и аудита.
Журналы запросов
Ниже приведен пример записи журнала запросов в формате JSON. Каждый большой двоичный объект имеет один корневой объект под названием records , который содержит массив объектов журнала.
{
"records":
[
. . . .
,
{
"time": "2016-07-07T21:02:53.456Z",
"resourceId": "/SUBSCRIPTIONS/<subscription_id>/RESOURCEGROUPS/<resource_group_name>/PROVIDERS/MICROSOFT.DATALAKESTORE/ACCOUNTS/<data_lake_storage_gen1_account_name>",
"category": "Requests",
"operationName": "GETCustomerIngressEgress",
"resultType": "200",
"callerIpAddress": "::ffff:1.1.1.1",
"correlationId": "4a11c709-05f5-417c-a98d-6e81b3e29c58",
"identity": "1808bd5f-62af-45f4-89d8-03c5e81bac30",
"properties": {"HttpMethod":"GET","Path":"/webhdfs/v1/Samples/Outputs/Drivers.csv","RequestContentLength":0,"StoreIngressSize":0 ,"StoreEgressSize":4096,"ClientRequestId":"3b7adbd9-3519-4f28-a61c-bd89506163b8","StartTime":"2016-07-07T21:02:52.472Z","EndTime":"2016-07-07T21:02:53.456Z","QueryParameters":"api-version=<version>&op=<operationName>"}
}
,
. . . .
]
}
Схема журнала запросов
Имя | Тип | Описание |
---|---|---|
time | Строка | Метка времени журнала (в формате UTC). |
resourceId | Строка | Идентификатор ресурса, с которым была выполнена операция. |
категория | Строка | Категория журнала. Например, Requests. |
operationName | Строка | Имя операции, добавленной в журнал. Например, getfilestatus. |
resultType | Строка | Состояние операции. Например, 200. |
callerIpAddress | Строка | IP-адрес клиента, отправившего запрос. |
correlationId | Строка | Идентификатор журнала, который можно использовать для формирования набора связанных записей журнала. |
удостоверение | Объект | Идентификатор, для которого был создан журнал. |
properties | JSON | Дополнительные сведения см. ниже. |
Схема свойств журнала запросов
Имя | Тип | Описание |
---|---|---|
HttpMethod | Строка | Метод HTTP, использованный для операции. Например, GET. |
Путь | Строка | Путь выполнения операции. |
RequestContentLength | INT | Длина содержимого HTTP-запроса. |
ClientRequestId | Строка | Идентификатор, однозначно определяющий данный запрос. |
StartTime | Строка | Время получения запроса сервером. |
EndTime | Строка | Время отправки ответа сервером. |
StoreIngressSize | Long | Размер в байтах, переданных в Data Lake Store |
StoreEgressSize | Long | Размер в байтах, полученных из Data Lake Store |
QueryParameters | Строка | Описание: это параметры HTTP-запроса. Пример 1: api-version=2014-01-01&op=getfilestatus Пример 2: op=APPEND&append=true&syncFlag=DATA&filesessionid=bee3355a-4925-4435-bb4d-ceea52811aeb&leaseid=bee3355a-4925-4435-bb4d-ceea52811aeb&offset=28313319&api-version=2017-08-01 |
Журналы аудита
Ниже приведен пример записи журнала аудита в формате JSON. Каждый большой двоичный объект имеет один корневой объект под названием records , который содержит массив объектов журнала.
{
"records":
[
. . . .
,
{
"time": "2016-07-08T19:08:59.359Z",
"resourceId": "/SUBSCRIPTIONS/<subscription_id>/RESOURCEGROUPS/<resource_group_name>/PROVIDERS/MICROSOFT.DATALAKESTORE/ACCOUNTS/<data_lake_storage_gen1_account_name>",
"category": "Audit",
"operationName": "SeOpenStream",
"resultType": "0",
"resultSignature": "0",
"correlationId": "381110fc03534e1cb99ec52376ceebdf;Append_BrEKAmg;25.66.9.145",
"identity": "A9DAFFAF-FFEE-4BB5-A4A0-1B6CBBF24355",
"properties": {"StreamName":"adl://<data_lake_storage_gen1_account_name>.azuredatalakestore.net/logs.csv"}
}
,
. . . .
]
}
Схема журнала аудита
Имя | Тип | Описание |
---|---|---|
time | Строка | Метка времени журнала (в формате UTC). |
resourceId | Строка | Идентификатор ресурса, с которым была выполнена операция. |
категория | Строка | Категория журнала. Например, Audit. |
operationName | Строка | Имя операции, добавленной в журнал. Например, getfilestatus. |
resultType | Строка | Состояние операции. Например, 200. |
resultSignature | Строка | Дополнительные сведения об операции. |
correlationId | Строка | Идентификатор журнала, который можно использовать для формирования набора связанных записей журнала. |
удостоверение | Объект | Идентификатор, для которого был создан журнал. |
properties | JSON | Дополнительные сведения см. ниже. |
Схема свойств журнала аудита
Имя | Тип | Описание |
---|---|---|
StreamName | Строка | Путь выполнения операции. |
Примеры обработки данных журнала
При отправке журналов из Azure Data Lake Storage 1-го поколения в журналы Azure Monitor (дополнительные сведения об использовании журналов Azure Monitor см. в статье Просмотр и анализ данных, собранных с помощью поиска по журналам Azure Monitor) указанный ниже запрос возвращает таблицу, которая содержит список отображаемых имен пользователей, время возникновения событий, количество событий для определенного времени возникновения события и диаграмму с визуализацией данных. Его можно легко изменить, чтобы отображался идентификатор GUID для пользователя или другие атрибуты:
search *
| where ( Type == "AzureDiagnostics" )
| summarize count(TimeGenerated) by identity_s, TimeGenerated
В Azure Data Lake Storage 1-го поколения есть пример обработки и анализа данных журнала. Этот пример можно найти по адресу https://github.com/Azure/AzureDataLake/tree/master/Samples/AzureDiagnosticsSample.