Travailler avec Azure Repos et les dépôts GitHub
Même si vous pouvez apporter des changements directement au code principal, il est recommandé d’utiliser le développement basé sur le tronc. En travaillant avec des branches, il est plus facile de vérifier si vos changements fonctionnent comme prévu avant de les fusionner avec le code principal.
Pour savoir comment le développement basé sur le tronc fonctionne en pratique, vous allez explorer le processus de mise à jour du code avec Azure DevOps et GitHub. Vous pouvez avoir besoin de modifier le code de vos workflows Machine Learning à tout moment. C’est pourquoi vous allez utiliser la planification agile pour décider quand mettre à jour le code et organiser votre travail.
Planification agile
Après le développement initial du modèle, vous disposez d’un modèle en production. Tout comme n’importe quelle application, un modèle n’est pas statique et peut nécessiter des ajustements petits ou grands au fil du temps pour être sûr qu’il est à jour. Une raison de la mise à jour et du réentraînement du modèle peut être la détection d’une dérive de données qui rend le modèle moins performant. Les données peuvent changer au fil du temps et, en conséquence, les modèles peuvent avoir besoin de changer aussi.
Pour planifier et organiser le travail que vous devez faire en tant que scientifique des données, vous pouvez utiliser Azure Boards dans Azure DevOps ou les problèmes GitHub.
Azure DevOps
Azure Boards organise une planification agile par suivi, visualisation et reporting des éléments de travail. Vous pouvez personnaliser de nombreuses choses pour les faire rentrer dans la planification de votre projet.
Conseil
Si vous souhaitez découvrir comment configurer et personnaliser Azure Boards, vous pouvez en savoir plus sur l’utilisation d’Azure Boards pour les charges de travail agiles ou consulter la documentation Azure Boards.
Plus important pour un scientifique des données, vous aurez un élément de travail qui vous sera attribué pour vous informer de ce que vous devez faire pour contribuer au projet de machine learning. Pour organiser votre travail, vous allez lier un élément de travail à une nouvelle branche.
Imaginez que vous êtes scientifique des données et que vous travaillez sur un projet de machine learning. L’équipe dispose d’un backlog d’éléments de travail ou d’éléments de backlog de produit, qui sont regroupés par caractéristique ou phase du cycle de vie du machine learning.
Une autre façon d’afficher les éléments de travail de ce projet consiste à accéder à Boards. En règle générale, vous avez des colonnes pour les éléments de travail nouveaux, actifs et fermés. Ou les tâches qu’il vous reste encore à faire, que vous êtes en train de faire ou qui sont déjà faites.
Pour récupérer un élément de travail et informer votre équipe que vous travaillez dessus, vous (ou quelqu’un d’autre) pouvez vous attribuer un élément de travail. Sélectionnez la zone Non attribuée, puis sélectionnez votre nom.
En sélectionnant l’élément de travail, vous pouvez également en voir les détails.
Dans le volet de contrôle Développement, vous pouvez sélectionner créer une branche pour créer une branche dans le dépôt, qui sera automatiquement liée à votre élément de travail. Une fois que vous l’avez créée, vous êtes redirigé vers la nouvelle branche où vous pouvez voir tous les éléments stockés dans votre dépôt.
Maintenant que la branche est créée, vous pouvez travailler dans la branche pour apporter des changements au code. Il est courant de cloner la branche dans un environnement de développement intégré (IDE) comme Visual Studio Code pour développer et tester en local avant de committer et de pousser les changements vers le dépôt principal.
GitHub
GitHub est une plateforme open source sur laquelle tous les outils sont organisés par dépôt. Une fois que vous avez créé un dépôt, vous pouvez utiliser des problèmes GitHub pour suivre vos éléments de travail, commentaires et bogues.
Lorsque vous ouvrez un dépôt dans GitHub, vous pouvez accéder à l’onglet Issues pour voir tous les problèmes ouverts et fermés. Vous pouvez sélectionner un problème pour en voir les détails. La personne qui crée le problème peut décrire le problème, en ajoutant des extraits de code ou des captures d’écran.
Une fois qu’un problème est créé, vous pouvez affecter le travail à vous-même ou à un autre utilisateur GitHub. Si vous souhaitez travailler sur le problème, vous pouvez créer une branche à partir du contrôle Development.
Un volet s’ouvre pour vous aider à créer une branche qui sera liée au problème. Automatiquement, la branche prend le nom du titre du problème. Vous pouvez changer le nom de la branche si vous le souhaitez.
Si vous revenez à l’onglet Code pour voir votre dépôt, vous pouvez passer d’une branche à l’autre et voir la nouvelle branche que vous avez créée.
Une fois que vous avez récupéré un élément de travail dans Azure DevOps ou un problème dans GitHub et créé une branche pour modifier le code, vous voudrez développer le code en local. Vous pouvez cloner le dépôt Git depuis Azure DevOps ou GitHub et travailler à partir de n’importe quel IDE de votre choix.