Używanie etykietowania usługi Azure Machine Learning w programie Language Studio
Etykietowanie danych jest ważną częścią przygotowywania zestawu danych. Korzystając ze środowiska etykietowania w usłudze Azure Machine Learning, możesz korzystać z łatwiejszej współpracy, większej elastyczności i możliwości outsourcingu zadań etykietowania do zewnętrznych dostawców etykietowania z witryny Azure Market Place. Do tworzenia etykiet usługi Azure Machine Learning można użyć:
Wymagania wstępne
Aby połączyć projekt etykietowania z usługą Azure Machine Learning, potrzebne są następujące elementy:
- Pomyślnie utworzono projekt Language Studio ze skonfigurowanym kontem usługi Azure Blob Storage.
- Dane tekstowe przekazane na konto magazynu.
- Przynajmniej:
- Jedna etykieta jednostki dla niestandardowego rozpoznawania nazwanej jednostki lub
- Dwie etykiety klas dla niestandardowych projektów klasyfikacji tekstu.
- Obszar roboczy usługi Azure Machine Learning, który został połączony z tym samym kontem usługi Azure Blob Storage używanym przez konto usługi Language Studio.
Ograniczenia
- Łączenie projektu etykietowania z usługą Azure Machine Learning jest połączeniem jeden do jednego. Jeśli rozłączysz projekt, nie będzie można połączyć projektu z powrotem z tym samym projektem usługi Azure Machine Learning
- Jednocześnie nie można oznaczyć etykiet w programie Language Studio i usłudze Azure Machine Learning. Środowisko etykietowania jest włączone w jednym studio naraz.
- Pliki testowania i trenowania w środowisku etykietowania, z którego się wycofasz, zostaną zignorowane podczas trenowania modelu.
- Do programu Language Studio można zaimportować tylko format pliku JSONL usługi Azure Machine Learning.
- Projekty z włączoną opcją wielojęzyczną nie mogą być połączone z usługą Azure Machine Learning, a nie wszystkie języki są obsługiwane.
- Obsługa języka jest zapewniana przez klasę TextDNNLanguages usługi Azure Machine Learning.
- Obszar roboczy usługi Azure Machine Learning, z którym nawiązujesz połączenie, musi być przypisany do tego samego konta usługi Azure Storage, z którym jest połączony program Language Studio. Upewnij się, że obszar roboczy usługi Azure Machine Learning ma uprawnienie czytelnika danych obiektu blob magazynu na koncie magazynu. Obszar roboczy musi zostać połączony z kontem magazynu podczas procesu tworzenia w witrynie Azure Portal.
- Przełączanie między dwoma środowiskami etykietowania nie jest natychmiastowe. Ukończenie operacji może zająć trochę czasu.
Importowanie etykiet usługi Azure Machine Learning do usługi Language Studio
Program Language Studio obsługuje format pliku JSONL używany przez usługę Azure Machine Learning. Jeśli etykietujesz dane w usłudze Azure Machine Learning, możesz zaimportować aktualne etykiety w nowym projekcie niestandardowym, aby korzystać z funkcji obu studiów.
Zacznij od utworzenia nowego projektu na potrzeby niestandardowej klasyfikacji tekstu lub niestandardowego rozpoznawania nazwanych jednostek.
Na wyświetlonym ekranie Tworzenie projektu postępuj zgodnie z monitami, aby połączyć konto magazynu, a następnie wprowadź podstawowe informacje o projekcie. Upewnij się, że używany zasób platformy Azure nie ma już połączonego innego konta magazynu.
W sekcji Wybieranie kontenera wybierz opcję wskazującą, że masz już poprawnie sformatowany plik. Następnie wybierz najnowszy plik etykiet usługi Azure Machine Learning.
Nawiązywanie połączenia z usługą Azure Machine Learning
Przed nawiązaniem połączenia z usługą Azure Machine Learning potrzebne jest konto usługi Azure Machine Learning z planem cenowym, który może zaspokoić potrzeby obliczeniowe projektu. Zapoznaj się z sekcją wymagań wstępnych, aby upewnić się, że wszystkie wymagania zostały pomyślnie spełnione, aby rozpocząć łączenie projektu programu Language Studio z usługą Azure Machine Learning.
Użyj witryny Azure Portal , aby przejść do konta usługi Azure Blob Storage połączonego z zasobem języka.
Upewnij się, że rola Współautor danych obiektu blob usługi Storage jest przypisana do obszaru roboczego usługi AML w ramach przypisań ról dla konta usługi Azure Blob Storage.
Przejdź do projektu w programie Language Studio. W menu nawigacji po lewej stronie projektu wybierz pozycję Etykietowanie danych.
Wybierz pozycję Użyj usługi Azure Machine Learning, aby oznaczyć etykietę w opisie etykietowania danych lub w okienku Działanie.
Wybierz pozycję Połącz z usługą Azure Machine Learning , aby rozpocząć proces połączenia.
W wyświetlonym oknie postępuj zgodnie z monitami. Wybierz obszar roboczy usługi Azure Machine Learning utworzony wcześniej w ramach tej samej subskrypcji platformy Azure. Wprowadź nazwę nowego projektu usługi Azure Machine Learning, który zostanie utworzony w celu włączenia etykietowania w usłudze Azure Machine Learning.
Napiwek
Przed kontynuowaniem upewnij się, że obszar roboczy jest połączony z tym samym kontem usługi Azure Blob Storage i zasobem języka. Możesz utworzyć nowy obszar roboczy i połączyć się z kontem magazynu przy użyciu witryny Azure Portal. Upewnij się, że konto magazynu jest prawidłowo połączone z obszarem roboczym.
(Opcjonalnie) Włącz przełącznik etykietowania dostawcy, aby używać firm dostawcy etykietowania. Przed wybraniem firm etykietowania dostawcy skontaktuj się z firmami etykietowania dostawców w witrynie Azure Marketplace , aby sfinalizować umowę z nimi. Aby uzyskać więcej informacji na temat pracy z firmami dostawcy, zobacz How to outsource data labeling (Jak zlecić etykietowanie danych).
Możesz również pozostawić instrukcje etykietowania dla etykiet ludzkich, które pomogą Ci w procesie etykietowania. Te instrukcje mogą pomóc im zrozumieć zadanie, pozostawiając jasne definicje etykiet i uwzględniając przykłady w celu uzyskania lepszych wyników.
Przejrzyj ustawienia połączenia z usługą Azure Machine Learning i w razie potrzeby wprowadź zmiany.
Ważne
Finalizowanie połączenia jest trwałe. Próba rozłączenia nawiązanego połączenia w dowolnym momencie spowoduje trwałe wyłączenie projektu programu Language Studio z nawiązywaniem połączenia z tym samym projektem usługi Azure Machine Learning.
Po zainicjowaniu połączenia możliwość etykietowania danych w programie Language Studio zostanie wyłączona przez kilka minut, aby przygotować nowe połączenie.
Przełączanie do etykietowania przy użyciu usługi Azure Machine Learning z usługi Language Studio
Po nawiązaniu połączenia możesz w dowolnym momencie przełączyć się na usługę Azure Machine Learning za pomocą okienka Działania w programie Language Studio.
Po przełączeniu możliwość etykietowania danych w programie Language Studio zostanie wyłączona i będzie można etykietować dane w usłudze Azure Machine Learning. W dowolnym momencie możesz przełączyć się z powrotem do etykietowania w programie Language Studio za pomocą usługi Azure Machine Learning.
Aby uzyskać informacje na temat etykietowania tekstu, zobacz Azure Machine Learning how to label (Jak oznaczyć tekst w usłudze Azure Machine Learning). Aby uzyskać informacje na temat zarządzania projektem etykietowania tekstu i śledzenia go, zobacz Konfigurowanie projektu etykietowania tekstu i zarządzanie nim.
Trenowanie modelu przy użyciu etykiet z usługi Azure Machine Learning
Po przełączeniu się do etykietowania przy użyciu usługi Azure Machine Learning można nadal trenować, oceniać i wdrażać model w programie Language Studio. Aby wytrenować model przy użyciu zaktualizowanych etykiet z usługi Azure Machine Learning:
Wybierz pozycję Zadania szkoleniowe z menu nawigacji po lewej stronie ekranu Language Studio dla projektu.
Wybierz pozycję Importuj najnowsze etykiety z usługi Azure Machine Learning w sekcji Wybieranie źródła etykiet na stronie trenowania. Spowoduje to zsynchronizowanie etykiet z usługi Azure Machine Learning przed rozpoczęciem zadania szkoleniowego.
Przełączanie do etykietowania za pomocą programu Language Studio z usługi Azure Machine Learning
Po przejściu na etykietowanie przy użyciu usługi Azure Machine Learning możesz w dowolnym momencie przełączyć się z powrotem do etykietowania przy użyciu projektu Language Studio.
Uwaga
- Tylko użytkownicy z odpowiednimi rolami w usłudze Azure Machine Learning mają możliwość przełączania etykiet.
- Po przełączeniu się do programu Language Studio etykietowanie w usłudze Azure Machine Learning zostanie wyłączone.
Aby wrócić do etykietowania za pomocą programu Language Studio:
Przejdź do projektu w usłudze Azure Machine Learning i wybierz pozycję Etykietowanie danych z menu nawigacji po lewej stronie.
Wybierz kartę Language Studio i wybierz pozycję Przełącz do programu Language Studio.
Ukończenie procesu potrwa kilka minut, a możliwość etykietowania w usłudze Azure Machine Learning zostanie wyłączona do momentu przełączenia z powrotem z programu Language Studio.
Odłączanie od usługi Azure Machine Learning
Odłączanie projektu od usługi Azure Machine Learning jest trwałym, nieodwracalnym procesem i nie można go cofnąć. Nie będzie już można uzyskać dostępu do etykiet w usłudze Azure Machine Learning i nie będzie można ponownie połączyć projektu usługi Azure Machine Learning z żadnym projektem language Studio w przyszłości. Aby odłączyć się od usługi Azure Machine Learning:
- Upewnij się, że wszystkie zaktualizowane etykiety, które chcesz zachować, są synchronizowane z usługą Azure Machine Learning, przełączając środowisko etykietowania z powrotem do programu Language Studio.
- Wybierz pozycję Ustawienia projektu z menu nawigacji po lewej stronie w programie Language Studio.
- Wybierz przycisk Rozłącz z usługą Azure Machine Learning w sekcji Zarządzanie połączeniami usługi Azure Machine Learning.
Następne kroki
Dowiedz się więcej na temat etykietowania danych dla niestandardowej klasyfikacji tekstu i niestandardowego rozpoznawania nazwanej jednostki.