Claves administradas por el cliente para Azure Machine Learning
Azure Machine Learning se basa en varios servicios de Azure. Aunque los datos almacenados se cifran mediante claves de cifrado que proporciona Microsoft, puede mejorar la seguridad si, además, proporciona sus propias claves (administradas por el cliente). Las claves que proporcione se almacenan en Azure Key Vault. Los datos se pueden almacenar en un conjunto de otros recursos que administra en su suscripción de Azure o (versión preliminar) en recursos administrados por Microsoft.
Además de las claves administradas por el cliente (CMK), Azure Machine Learning también proporciona una marca hbi_workspace. Habilitar esta marca reduce la cantidad de datos que Microsoft recopila para fines de diagnóstico y permite el cifrado adicional en entornos administrados por Microsoft. Esta marca también habilita los comportamientos siguientes:
- Inicia el cifrado del disco temporal local en el clúster de proceso de Azure Machine Learning si no ha creado ningún clúster anterior en esa suscripción. En caso contrario, debe generar una incidencia de soporte técnico para habilitar el cifrado del disco temporal de los clústeres de proceso.
- Limpia el disco temporal local entre trabajos.
- Pasa de forma segura las credenciales de la cuenta de almacenamiento, el registro de contenedor y la cuenta de Secure Shell (SSH) desde la capa de ejecución a los clústeres de proceso mediante el almacén de claves.
La marca hbi_workspace
no afecta al cifrado en tránsito. Afecta solo al cifrado en reposo.
Requisitos previos
- Suscripción a Azure.
- Una instancia de Azure Key Vault. El almacén de claves contiene las claves para cifrar los servicios.
El almacén debe habilitar la eliminación temporal y la protección de purga. La identidad administrada de los servicios que ayuda a proteger mediante el uso de una clave administrada por el cliente debe tener los permisos siguientes en el almacén de claves:
- Encapsular clave
- Desencapsular clave
- Obtener
Por ejemplo, la identidad administrada para Azure Cosmos DB tendría que tener esos permisos para el almacén de claves.
Limitaciones
- Tras la creación del área de trabajo, la clave de cifrado administrada por el cliente para los recursos de los que depende el área de trabajo solo se puede actualizar a otra clave del recurso original de Azure Key Vault.
- A menos que utilice la versión preliminar del servidor, los datos cifrados se almacenan en los recursos de un grupo de recursos administrado por Microsoft en su suscripción. No puede crear estos recursos por adelantado ni transferirse la propiedad de estos. El ciclo de vida de los datos se administra indirectamente mediante las API de Azure Machine Learning a medida que crea objetos en el servicio Azure Machine Learning.
- No se pueden eliminar los recursos administrados por Microsoft que usa para las claves administradas por el cliente sin eliminar también el área de trabajo.
- No se puede cifrar el disco del sistema operativo del clúster de proceso mediante las claves administradas por el cliente. Debe usar claves administradas por Microsoft.
Advertencia
No elimine el grupo de recursos que contiene esta instancia de Azure Cosmos DB, ni ninguno de los recursos que se crean de forma automática en este grupo. Si tiene que eliminar el grupo de recursos o los servicios administrados por Microsoft en él incluidos, debe eliminar el área de trabajo de Azure Machine Learning que lo usa. Los recursos del grupo de recursos se eliminan cuando elimina el área de trabajo asociada.
Claves administradas por el cliente
Cuando no se usa una clave administrada por el cliente, Microsoft crea y administra estos recursos en una suscripción de Azure propiedad de Microsoft, y usa una clave administrada por Microsoft para cifrar los datos.
Cuando se usa una clave administrada por el cliente, los recursos se encuentran en la suscripción de Azure y se cifran con la clave. Aunque estos recursos existen en la suscripción, Microsoft los administra. Estos recursos se crean y configuran automáticamente al crear el área de trabajo de Azure Machine Learning.
Estos recursos administrados por Microsoft se encuentran en un nuevo grupo de recursos de Azure creado en la suscripción. Este grupo de recursos es independiente del grupo de recursos del área de trabajo. Contiene los recursos administrados por Microsoft con los que se usa la clave. La fórmula para asignar un nombre al grupo de recursos es: <Azure Machine Learning workspace resource group name><GUID>
.
Sugerencia
Las Unidades de solicitud de Azure Cosmos DB se escalan automáticamente según sea necesario.
Si el área de trabajo de Azure Machine Learning usa un punto de conexión privado, este grupo de recursos también contiene una instancia de Azure Virtual Network administrada por Microsoft. Esta red virtual ayuda a proteger la comunicación entre los servicios administrados y el área de trabajo. No puede proporcionar su propia red virtual para su uso con los recursos administrados por Microsoft. Tampoco puede modificar la red virtual. Por ejemplo, no puede cambiar el rango de direcciones IP que usa.
Importante
Si la suscripción no tiene suficiente cuota para estos servicios, se producirá un error.
Cuando usa una clave administrada por el cliente, los costos de la suscripción son mayores, ya que estos recursos están en su suscripción. Puede usar la calculadora de precios de Azure para calcular los costos.
Cifrado de datos en recursos de proceso
Azure Machine Learning usa recursos de proceso para entrenar e implementar modelos de Machine Learning. En la tabla siguiente, se describen las opciones de proceso y cómo cada una cifra los datos:
Proceso | Cifrado |
---|---|
Azure Container Instances | Los datos se cifran con una clave administrada por Microsoft o una clave administrada por el cliente. Para obtener más información, consulte Cifrado de datos de implementación. |
Azure Kubernetes Service | Los datos se cifran con una clave administrada por Microsoft o una clave administrada por el cliente. Para obtener más información, consulte Traiga sus propias claves con discos de Azure en Azure Kubernetes Service. |
Instancia de proceso de Azure Machine Learning | El disco temporal local se cifra si habilita la marca hbi_workspace para el área de trabajo. |
Clúster de proceso de Azure Machine Learning | El disco del sistema operativo se cifra en Azure Storage con claves administradas por Microsoft. El disco temporal se cifra si habilita la marca hbi_workspace para el área de trabajo. |
Proceso | Cifrado |
---|---|
Azure Kubernetes Service | Los datos se cifran con una clave administrada por Microsoft o una clave administrada por el cliente. Para obtener más información, consulte Traiga sus propias claves con discos de Azure en Azure Kubernetes Service. |
Instancia de proceso de Azure Machine Learning | El disco temporal local se cifra si habilita la marca hbi_workspace para el área de trabajo. |
Clúster de proceso de Azure Machine Learning | El disco del sistema operativo se cifra en Azure Storage con claves administradas por Microsoft. El disco temporal se cifra si habilita la marca hbi_workspace para el área de trabajo. |
Clúster de proceso
Los clústeres de proceso tienen almacenamiento en disco del sistema operativo local y pueden montar datos de cuentas de almacenamiento en la suscripción durante un trabajo. Al montar datos desde su propia cuenta de almacenamiento en un trabajo, puede habilitar claves administradas por el cliente en esas cuentas de almacenamiento para el cifrado.
El disco del sistema operativo de cada nodo de ejecución se almacena en Azure Storage y siempre se cifra mediante claves administradas por Microsoft en las cuentas de almacenamiento de Azure Machine Learning, y no con claves administradas por el cliente. Este destino de proceso es efímero, por lo que los datos almacenados en el disco del sistema operativo se eliminan después de que el clúster se reduzca verticalmente. Por lo general, los clústeres se reducen verticalmente cuando no hay trabajos en cola, el escalado automático está activado y el número mínimo de nodos se establece en cero. La máquina virtual subyacente se desaprovisiona y el disco del sistema operativo se elimina.
Azure Disk Encryption no se admite con el disco del sistema operativo. Cada máquina virtual tiene también un disco local temporal para las operaciones del sistema operativo. Si quiere, puede usar el disco para almacenar temporalmente los datos de entrenamiento. Si crea el área de trabajo con el parámetro hbi_workspace
establecido en TRUE
, el disco temporal se cifra. Este entorno es de corta duración (solo dura el tiempo del trabajo) y la compatibilidad con el cifrado se limita únicamente a las claves administradas por el sistema.
Instancia de proceso
El disco del sistema operativo de una instancia de proceso se cifra mediante claves administradas por Microsoft en las cuentas de almacenamiento de Azure Machine Learning. Si crea el área de trabajo con el parámetro hbi_workspace
establecido en TRUE
, el disco temporal local en la instancia de proceso se cifra con claves administradas por Microsoft. El cifrado de claves administradas por el cliente no se admite en los discos temporales y de sistema operativo.
Almacenamiento de metadatos cifrados del área de trabajo
Al traer su propia clave de cifrado, los metadatos del servicio se almacenan en recursos dedicados de la suscripción de Azure. Microsoft crea un grupo de recursos independiente en la suscripción para este fin: azureml-rg-workspacename_GUID. Solo Microsoft puede modificar los recursos de este grupo de recursos administrados.
Microsoft crea los siguientes recursos para almacenar metadatos para el área de trabajo:
Service | Uso | Datos de ejemplo |
---|---|---|
Azure Cosmos DB | Almacena datos del historial de trabajos, metadatos de proceso, metadatos de recursos. | Los datos pueden incluir nombre del trabajo, estado, número de secuencia y estado; nombre del clúster de proceso, número de núcleos y número de nodos; nombres y etiquetas del almacén de datos, y descripciones de recursos como modelos; y nombres de etiquetas de datos |
Azure AI Search | Almacena índices que ayudan a consultar el contenido de aprendizaje automático. | Estos índices se basan en los datos almacenados en Azure Cosmos DB. |
Azure Storage | Almacena metadatos relacionados con los datos de canalizaciones de Azure Machine Learning. | Los datos pueden incluir nombres de canalización de diseñador, diseño de canalización y propiedades de ejecución. |
Desde la perspectiva de la administración del ciclo de vida de los datos, los datos de los recursos anteriores se crean y eliminan a medida que se crean y eliminan los objetos correspondientes en Azure Machine Learning.
El área de trabajo de Azure Machine Learning lee y escribe datos mediante su identidad administrada. A esta identidad se le concede acceso a los recursos mediante una asignación de roles (control de acceso basado en roles de Azure) en los recursos de datos. La clave de cifrado que proporciona se usa para cifrar los datos que se almacenan en recursos administrados por Microsoft. En el runtime, también se usa la clave para crear índices para Búsqueda de Azure AI.
Los controles de conexión en red adicionales se configuran al crear un punto de conexión de vínculo privado en el área de trabajo para permitir la conectividad de entrada. Esta configuración incluye la creación de una conexión de punto de conexión de vínculo privado a la instancia de Azure Cosmos DB. El acceso a la red está restringido solo a los servicios de Microsoft de confianza.
(Versión preliminar) Cifrado del lado del servicio de metadatos
Hay disponible una nueva arquitectura para el área de trabajo de cifrado de claves administradas por el cliente en versión preliminar, lo que reduce el coste en comparación con la arquitectura actual y mitiga la probabilidad de conflictos de directivas de Azure. En este nuevo modelo, los datos cifrados se almacenan en el lado del servicio en los recursos administrados por Microsoft en lugar de en la suscripción.
Los datos almacenados anteriormente en Azure Cosmos DB en la suscripción se almacenan en recursos administrados por Microsoft multiinquilino con el cifrado de nivel de documento con la clave de cifrado. Los índices de búsqueda que se almacenaron anteriormente en Búsqueda de Azure AI en la suscripción se almacenan en recursos administrados por Microsoft que se aprovisionan de forma dedicada por área de trabajo. El coste de la instancia de Búsqueda de Azure AI se cobra en el área de trabajo de Azure Machine Learning en Azure Cost Management.
Los metadatos de canalizaciones almacenados anteriormente en una cuenta de almacenamiento de un grupo de recursos administrados ahora se almacenan en la cuenta de almacenamiento de la suscripción asociada al área de trabajo de Azure Machine Learning. Dado que este recurso de Azure Storage se administra por separado en la suscripción, es responsable de configurar las opciones de cifrado en el.
Para participar en esta versión preliminar, establezca el enableServiceSideCMKEncryption
en una API de REST o en la plantilla de Resource Manager o Bicep. También puede usar Azure Portal.
Nota:
Durante esta versión preliminar no se admiten las funcionalidades de rotación de claves y etiquetado de datos. Actualmente no se admite el cifrado del lado servidor en referencia a una instancia de Azure Key Vault para almacenar la clave de cifrado que tenga deshabilitado el acceso a la red pública.
Para obtener una plantilla que cree un área de trabajo con cifrado del lado del servicio de metadatos, consulte
- Plantilla de Bicep para crear un área de trabajo predeterminada.
- Plantilla de Bicep para crear el área de trabajo central.
Marca HBI_workspace
Solo puede establecer la marca hbi_workspace
cuando se crea un área de trabajo. No se puede cambiar para un área de trabajo existente.
Al establecer esta marca en TRUE
, puede aumentar la dificultad de solucionar problemas porque se envían menos datos de telemetría a Microsoft. Hay menos visibilidad sobre las tasas de éxito o los tipos de problemas. Es posible que Microsoft no pueda reaccionar de forma proactiva cuando esta marca esté establecida en TRUE
.
Para habilitar la marca hbi_workspace
al crear un área de trabajo de Azure Machine Learning, siga los pasos descritos en uno de los siguientes artículos:
- Creación y administración de un área de trabajo mediante Azure Portal o el SDK de Python
- Creación y administración de áreas de trabajo mediante la CLI de Azure
- Creación de un área de trabajo mediante HashiCorp Terraform
- Creación de un área de trabajo mediante plantillas de Azure Resource Manager