Compreender os URIs
Você pode armazenar dados em seu dispositivo local ou em algum lugar na nuvem. Onde quer que você armazene seus dados, você deseja acessá-los ao treinar modelos de aprendizado de máquina. Para localizar e acessar dados no Aprendizado de Máquina do Azure, você pode usar URIs (Uniform Resource Identifiers).
Compreender os URIs
Um URI faz referência ao local dos seus dados. Para que o Aprendizado de Máquina do Azure se conecte aos seus dados, você precisa prefixar o URI com o protocolo apropriado. Há três protocolos comuns ao trabalhar com dados no contexto do Azure Machine Learning:
http(s)
: Use para armazenamentos de dados pública ou privadamente em um Armazenamento de Blob do Azure ou local http(s) disponível publicamente.abfs(s)
: Use para armazenamentos de dados em um Azure Data Lake Storage Gen 2.azureml
: Use para dados armazenados em um armazenamento de dados.
Por exemplo, você pode criar um Armazenamento de Blob do Azure no Azure. Para armazenar dados, crie um contêiner chamado training-data
. Dentro do contêiner, você cria uma pasta datastore-path
. Dentro da pasta, você armazena o arquivo diabetes.csv
CSV .
Quando quiser acessar os dados do espaço de trabalho do Azure Machine Learning, você pode usar o caminho para a pasta ou arquivo diretamente. Quando você quiser se conectar à pasta ou arquivo diretamente, você pode usar o http(s)
protocolo. Se o contêiner estiver definido como privado, você precisará fornecer algum tipo de autenticação para obter acesso aos dados, como uma Assinatura de Acesso Compartilhado (SAS).
Ao criar um armazenamento de dados no Aprendizado de Máquina do Azure, você armazenará as informações de conexão e autenticação no espaço de trabalho. Em seguida, para acessar os dados no contêiner, você pode usar o azureml
protocolo.
Gorjeta
Um armazenamento de dados é uma referência a uma conta de armazenamento existente no Azure. Portanto, quando você se refere a dados armazenados em um armazenamento de dados, você pode estar se referindo a dados que estão sendo armazenados em um Armazenamento de Blob do Azure ou Armazenamento do Azure Data Lake. No entanto, quando você se refere ao armazenamento de dados, não precisará autenticar, pois as informações de conexão armazenadas com o armazenamento de dados serão usadas pelo Aprendizado de Máquina do Azure.
É considerada uma prática recomendada evitar dados confidenciais em seu código, como informações de autenticação. Portanto, sempre que possível, você deve trabalhar com armazenamentos de dados e ativos de dados no Azure Machine Learning. No entanto, durante a experimentação em notebooks, convém conectar-se diretamente a um local de armazenamento para evitar sobrecarga desnecessária.