Udostępnij za pośrednictwem


Instalowanie i uruchamianie kontenerów wykrywania informacji osobowych (PII)

Uwaga

Limity danych dla kontenera piI to 5120 znaków i maksymalnie 10 dokumentów.

Kontenery umożliwiają hostowanie interfejsu API wykrywania danych pii we własnej infrastrukturze. Jeśli masz wymagania dotyczące zabezpieczeń lub ładu danych, których nie można spełnić przez zdalne wywoływanie funkcji wykrywania danych pii, kontenery mogą być dobrym rozwiązaniem.

Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.

Wymagania wstępne

Przed użyciem kontenerów wykrywania danych pii należy spełnić następujące wymagania wstępne.

  • Jeśli nie masz subskrypcji platformy Azure, utwórz bezpłatne konto.
  • Platforma Docker zainstalowana na komputerze hosta. Platforma Docker musi być skonfigurowana tak, aby umożliwić kontenerom łączenie się z platformą Azure i wysyłanie danych rozliczeniowych do platformy Azure.
    • W systemie Windows platforma Docker musi być również skonfigurowana do obsługi kontenerów systemu Linux.
    • Musisz mieć podstawową wiedzę na temat pojęć związanych z platformą Docker.
  • Zasób języka

Zbieranie wymaganych parametrów

Wymagane są trzy podstawowe parametry dla wszystkich kontenerów sztucznej inteligencji platformy Azure. Postanowienia licencyjne dotyczące oprogramowania firmy Microsoft muszą być obecne z wartością akceptacji. Wymagany jest również identyfikator URI punktu końcowego i klucz interfejsu API.

Identyfikator URI punktu końcowego

Wartość {ENDPOINT_URI} jest dostępna na stronie Przegląd witryny Azure Portal odpowiedniego zasobu usług Azure AI. Przejdź do strony Przegląd, umieść kursor nad punktem końcowym, a zostanie wyświetlona ikona Kopiuj do schowka. Skopiuj i użyj punktu końcowego w razie potrzeby.

Zrzut ekranu przedstawiający zbieranie identyfikatora URI punktu końcowego do późniejszego użycia.

Klucze

Wartość {API_KEY} jest używana do uruchamiania kontenera i jest dostępna na stronie Klucze witryny Azure Portal odpowiedniego zasobu usług Azure AI. Przejdź do strony Klucze i wybierz ikonę Kopiuj do schowka.

Zrzut ekranu przedstawiający pobranie jednego z dwóch kluczy do późniejszego użycia.

Ważne

Te klucze subskrypcji są używane do uzyskiwania dostępu do interfejsu API usług Azure AI. Nie udostępniaj kluczy. Przechowuj je bezpiecznie. Na przykład użyj usługi Azure Key Vault. Zalecamy również regularne ponowne generowanie tych kluczy. Tylko jeden klucz jest wymagany do wykonania wywołania interfejsu API. Podczas ponownego generowania pierwszego klucza można użyć drugiego klucza w celu dalszego dostępu do usługi.

Wymagania i zalecenia dotyczące komputera hosta

Host to komputer oparty na architekturze x64 z uruchomionym kontenerem platformy Docker. Może to być komputer lokalny lub usługa hostingu platformy Docker na platformie Azure, taka jak:

W poniższej tabeli opisano minimalne i zalecane specyfikacje dla dostępnego kontenera. Każdy rdzeń procesora CPU musi być co najmniej 2,6 gigahertz (GHz) lub szybszy.

Zaleca się posiadanie procesora CPU z zestawem instrukcji AVX-512, aby uzyskać najlepsze środowisko (wydajność i dokładność).

Minimalna specyfikacja hosta Zalecane specyfikacje hosta
Wykrywanie danych pii 1 rdzeń, 2 GB pamięci 4 rdzenie, 8 GB pamięci

Rdzenie procesora CPU i pamięć odpowiadają --cpus ustawieniu i --memory , które są używane w ramach docker run polecenia .

Pobieranie obrazu kontenera za pomocą polecenia docker pull

Obraz kontenera wykrywania piI można znaleźć w mcr.microsoft.com syndykacie rejestru kontenerów. Znajduje się on w azure-cognitive-services/textanalytics/ repozytorium i ma nazwę pii. W pełni kwalifikowana nazwa obrazu kontenera to: mcr.microsoft.com/azure-cognitive-services/textanalytics/pii

Aby użyć najnowszej wersji kontenera, możesz użyć tagu latest , który jest przeznaczony dla języka angielskiego. Możesz również znaleźć pełną listę kontenerów dla obsługiwanych języków przy użyciu tagów w mcR.

Najnowszy kontener wykrywania danych pii jest dostępny w kilku językach. Aby pobrać kontener dla kontenera języka angielskiego, użyj poniższego polecenia.

docker pull mcr.microsoft.com/azure-cognitive-services/textanalytics/pii:latest

Napiwek

Możesz użyć polecenia docker images , aby wyświetlić listę pobranych obrazów kontenerów. Na przykład następujące polecenie wyświetla identyfikator, repozytorium i tag każdego pobranego obrazu kontenera sformatowane jako tabela:

docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"

IMAGE ID         REPOSITORY                TAG
<image-id>       <repository-path/name>    <tag-name>

Uruchamianie kontenera za pomocą polecenia docker run

Gdy kontener znajduje się na komputerze hosta, użyj polecenia docker run , aby uruchomić kontenery. Kontener będzie nadal działać do momentu jego zatrzymania. Zastąp symbole zastępcze poniżej własnymi wartościami:

Ważne

  • Polecenia platformy Docker w poniższych sekcjach używają ukośnika odwrotnego , \jako znaku kontynuacji wiersza. Zastąp lub usuń to na podstawie wymagań systemu operacyjnego hosta.
  • Aby Eulauruchomić kontener, należy określić opcje , Billingi ApiKey . W przeciwnym razie kontener nie zostanie uruchomiony. Aby uzyskać więcej informacji, zobacz Rozliczenia.

Aby uruchomić kontener wykrywania danych pii, wykonaj następujące docker run polecenie. Zastąp symbole zastępcze poniżej własnymi wartościami:

Symbol zastępczy Wartość Formatowanie lub przykład
{API_KEY} Klucz zasobu Language. Możesz go znaleźć na stronie Klucz i punkt końcowy zasobu w witrynie Azure Portal. xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
{ENDPOINT_URI} Punkt końcowy umożliwiający uzyskiwanie dostępu do interfejsu API. Możesz go znaleźć na stronie Klucz i punkt końcowy zasobu w witrynie Azure Portal. https://<your-custom-subdomain>.cognitiveservices.azure.com
{IMAGE_TAG} Tag obrazu reprezentujący język kontenera, który chcesz uruchomić. Upewnij się, że jest to zgodne z użytym poleceniem docker pull . latest
docker run --rm -it -p 5000:5000 --memory 8g --cpus 1 \
mcr.microsoft.com/azure-cognitive-services/textanalytics/pii:{IMAGE_TAG} \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

To polecenie:

  • Uruchamia kontener wykrywania danych użytkownika z obrazu kontenera
  • Przydziela jeden rdzeń procesora CPU i 8 gigabajtów pamięci (GB)
  • Uwidacznia port TCP 5000 i przydziela pseudo-TTY dla kontenera
  • Automatycznie usuwa kontener po jego zakończeniu. Obraz kontenera jest nadal dostępny na komputerze hosta.

Uruchamianie wielu kontenerów na tym samym hoście

Jeśli zamierzasz uruchomić wiele kontenerów z uwidocznionych portów, upewnij się, że każdy kontener ma inny uwidoczniony port. Na przykład uruchom pierwszy kontener na porcie 5000 i drugi kontener na porcie 5001.

Ten kontener i inny kontener usług Azure AI mogą być uruchomione razem na hoście. Można również mieć wiele kontenerów tego samego kontenera usług Azure AI, na których działa.

Wykonywanie zapytania dotyczącego punktu końcowego przewidywania kontenera

Kontener udostępnia oparte na interfejsie REST interfejsy API punktu końcowego przewidywania zapytań.

Użyj hosta http://localhost:5000 dla interfejsów API kontenera.

Sprawdzanie, czy kontener jest uruchomiony

Istnieje kilka sposobów sprawdzania, czy kontener jest uruchomiony. Znajdź zewnętrzny adres IP i uwidoczniony port danego kontenera i otwórz ulubioną przeglądarkę internetową. Użyj różnych adresów URL żądań, które są zgodne z instrukcjami, aby sprawdzić, czy kontener jest uruchomiony. Przykładowe adresy URL żądań wymienione w tym miejscu to http://localhost:5000, ale określony kontener może się różnić. Upewnij się, że korzystasz z zewnętrznego adresu IP kontenera i uwidocznij port.

Adres URL żądania Purpose
http://localhost:5000/ Kontener zawiera stronę główną.
http://localhost:5000/ready Żądany przy użyciu polecenia GET ten adres URL zapewnia weryfikację, że kontener jest gotowy do akceptowania zapytania względem modelu. To żądanie może służyć do sond gotowości i gotowości platformy Kubernetes.
http://localhost:5000/status Ten adres URL sprawdza również, czy klucz api-key używany do uruchamiania kontenera jest prawidłowy bez powodowania zapytania punktu końcowego. To żądanie może służyć do sond gotowości i gotowości platformy Kubernetes.
http://localhost:5000/swagger Kontener zawiera pełen zestaw dokumentacji dla punktów końcowych oraz funkcję Wypróbuj. Dzięki tej funkcji możesz wprowadzić ustawienia w formularzu HTML opartym na sieci Web i utworzyć zapytanie bez konieczności pisania kodu. Po powrocie zapytania zostanie udostępnione przykładowe polecenie CURL, aby zademonstrować wymagane nagłówki HTTP i format treści.

Strona główna kontenera

Aby uzyskać informacje na temat sposobu wywoływania danych osobowych, zobacz nasz przewodnik.

Uruchamianie kontenera odłączonego od Internetu

Aby użyć tego kontenera odłączonego od Internetu, musisz najpierw zażądać dostępu, wypełniając aplikację i kupując plan zobowiązania. Aby uzyskać więcej informacji, zobacz Use Docker containers in disconnected environments (Używanie kontenerów platformy Docker w środowiskach bez połączenia).

Jeśli kontener został zatwierdzony do uruchomienia kontenera odłączonego od Internetu, użyj poniższego przykładu pokazującego formatowanie używanego docker run polecenia z wartościami zastępczymi. Zastąp te wartości zastępcze własnymi wartościami.

Parametr DownloadLicense=True w poleceniu docker run pobierze plik licencji, który umożliwi uruchomienie kontenera platformy Docker, gdy nie jest połączony z Internetem. Zawiera również datę wygaśnięcia, po której plik licencji będzie nieprawidłowy do uruchomienia kontenera. Możesz użyć pliku licencji tylko z odpowiednim kontenerem, dla którego został zatwierdzony. Na przykład nie można użyć pliku licencji dla kontenera zamiany mowy na tekst z kontenerem analizy dokumentów.

Symbol zastępczy Wartość Formatowanie lub przykład
{IMAGE} Obraz kontenera, którego chcesz użyć. mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice
{LICENSE_MOUNT} Ścieżka, w której zostanie pobrana licencja, i zainstalowana. /host/license:/path/to/license/directory
{ENDPOINT_URI} Punkt końcowy do uwierzytelniania żądania obsługi. Możesz go znaleźć na stronie Klucz i punkt końcowy zasobu w witrynie Azure Portal. https://<your-custom-subdomain>.cognitiveservices.azure.com
{API_KEY} Klucz zasobu analiza tekstu. Możesz go znaleźć na stronie Klucz i punkt końcowy zasobu w witrynie Azure Portal. xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
{CONTAINER_LICENSE_DIRECTORY} Lokalizacja folderu licencji w lokalnym systemie plików kontenera. /path/to/license/directory
docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY} 

Po pobraniu pliku licencji można uruchomić kontener w środowisku odłączonym. W poniższym przykładzie pokazano formatowanie docker run polecenia, którego użyjesz, z wartościami zastępczymi. Zastąp te wartości zastępcze własnymi wartościami.

Wszędzie tam, gdzie kontener jest uruchamiany, plik licencji musi być zainstalowany w kontenerze, a lokalizacja folderu licencji w lokalnym systemie plików kontenera musi być określona za pomocą Mounts:License=polecenia . Należy również określić instalację wyjściową, aby można było zapisywać rekordy użycia rozliczeń.

Symbol zastępczy Wartość Formatowanie lub przykład
{IMAGE} Obraz kontenera, którego chcesz użyć. mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice
{MEMORY_SIZE} Odpowiedni rozmiar pamięci do przydzielenia dla kontenera. 4g
{NUMBER_CPUS} Odpowiednia liczba procesorów CPU do przydzielenia dla kontenera. 4
{LICENSE_MOUNT} Ścieżka, w której będzie znajdować się i instalowana licencja. /host/license:/path/to/license/directory
{OUTPUT_PATH} Ścieżka wyjściowa rejestrowania rekordów użycia. /host/output:/path/to/output/directory
{CONTAINER_LICENSE_DIRECTORY} Lokalizacja folderu licencji w lokalnym systemie plików kontenera. /path/to/license/directory
{CONTAINER_OUTPUT_DIRECTORY} Lokalizacja folderu wyjściowego w lokalnym systemie plików kontenera. /path/to/output/directory
docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Zatrzymywanie kontenera

Aby zamknąć kontener, w środowisku wiersza polecenia, w którym jest uruchomiony kontener, wybierz Ctrl+C.

Rozwiązywanie problemów

Jeśli uruchamiasz kontener z włączoną instalacją danych wyjściowych i rejestrowaniem, kontener generuje pliki dziennika, które są pomocne w rozwiązywaniu problemów występujących podczas uruchamiania lub uruchamiania kontenera.

Napiwek

Aby uzyskać więcej informacji na temat rozwiązywania problemów i wskazówek, zobacz Często zadawane pytania dotyczące kontenerów usługi Azure AI.

Rozliczenia

Kontenery wykrywania danych osobowych wysyłają informacje rozliczeniowe na platformę Azure przy użyciu zasobu języka na koncie platformy Azure.

Zapytania do kontenera są rozliczane w warstwie cenowej zasobu platformy Azure używanego dla parametru ApiKey .

Kontenery usług AI platformy Azure nie są licencjonowane do uruchamiania bez połączenia z punktem końcowym pomiaru użytkowania ani rozliczeń. Należy zezwolić kontenerom na komunikowanie informacji rozliczeniowych z punktem końcowym rozliczeń przez cały czas. Kontenery usług AI platformy Azure nie wysyłają do firmy Microsoft danych klientów, takich jak obraz lub tekst analizowany.

Łączenie się z platformą Azure

Do uruchomienia kontenera potrzebne są wartości argumentów rozliczeniowych. Te wartości umożliwiają kontenerowi łączenie się z punktem końcowym rozliczeń. Kontener raportuje użycie co około 10 do 15 minut. Jeśli kontener nie łączy się z platformą Azure w dozwolonym przedziale czasu, kontener będzie nadal działać, ale nie obsługuje zapytań, dopóki punkt końcowy rozliczeń nie zostanie przywrócony. Próba nawiązania połączenia jest podejmowana 10 razy w tym samym przedziale czasu od 10 do 15 minut. Jeśli nie może nawiązać połączenia z punktem końcowym rozliczeń w ciągu 10 prób, kontener przestanie obsługiwać żądania. Zobacz często zadawane pytania dotyczące kontenera usług AI platformy Azure, aby uzyskać przykład informacji wysyłanych do firmy Microsoft na potrzeby rozliczeń.

Argumenty rozliczeniowe

Polecenie docker run uruchomi kontener, gdy wszystkie trzy z następujących opcji są dostarczane z prawidłowymi wartościami:

Opcja Opis
ApiKey Klucz interfejsu API zasobu usług Azure AI używany do śledzenia informacji rozliczeniowych.
Wartość tej opcji musi być ustawiona na klucz interfejsu API dla zaaprowizowanego zasobu określonego w pliku Billing.
Billing Punkt końcowy zasobu usług Azure AI używany do śledzenia informacji rozliczeniowych.
Wartość tej opcji musi być ustawiona na identyfikator URI punktu końcowego aprowizowanego zasobu platformy Azure.
Eula Wskazuje, że zaakceptowano licencję dla kontenera.
Wartość tej opcji należy ustawić tak, aby akceptowała.

Aby uzyskać więcej informacji na temat tych opcji, zobacz Konfigurowanie kontenerów.

Podsumowanie

W tym artykule przedstawiono pojęcia i przepływ pracy dotyczące pobierania, instalowania i uruchamiania kontenerów wykrywania danych pii. Podsumowując:

  • Wykrywanie piI zapewnia kontenery systemu Linux dla platformy Docker
  • Obrazy kontenerów są pobierane z usługi Microsoft Container Registry (MCR).
  • Obrazy kontenerów są uruchamiane na platformie Docker.
  • Podczas tworzenia wystąpienia kontenera należy określić informacje o rozliczeniach.

Ważne

Kontenery sztucznej inteligencji platformy Azure nie mają licencji na uruchamianie bez nawiązywania połączenia z platformą Azure na potrzeby pomiaru użytkowania. Klienci muszą umożliwić kontenerom komunikowanie informacji rozliczeniowych z usługą pomiarów przez cały czas. Kontenery sztucznej inteligencji platformy Azure nie wysyłają danych klienta (np. tekstu analizowanego) do firmy Microsoft.

Następne kroki