Instalowanie i uruchamianie kontenerów wykrywania informacji osobowych (PII)
Uwaga
Limity danych dla kontenera piI to 5120 znaków i maksymalnie 10 dokumentów.
Kontenery umożliwiają hostowanie interfejsu API wykrywania danych pii we własnej infrastrukturze. Jeśli masz wymagania dotyczące zabezpieczeń lub ładu danych, których nie można spełnić przez zdalne wywoływanie funkcji wykrywania danych pii, kontenery mogą być dobrym rozwiązaniem.
Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
Wymagania wstępne
Przed użyciem kontenerów wykrywania danych pii należy spełnić następujące wymagania wstępne.
- Jeśli nie masz subskrypcji platformy Azure, utwórz bezpłatne konto.
- Platforma Docker zainstalowana na komputerze hosta. Platforma Docker musi być skonfigurowana tak, aby umożliwić kontenerom łączenie się z platformą Azure i wysyłanie danych rozliczeniowych do platformy Azure.
- W systemie Windows platforma Docker musi być również skonfigurowana do obsługi kontenerów systemu Linux.
- Musisz mieć podstawową wiedzę na temat pojęć związanych z platformą Docker.
- Zasób języka
Zbieranie wymaganych parametrów
Wymagane są trzy podstawowe parametry dla wszystkich kontenerów sztucznej inteligencji platformy Azure. Postanowienia licencyjne dotyczące oprogramowania firmy Microsoft muszą być obecne z wartością akceptacji. Wymagany jest również identyfikator URI punktu końcowego i klucz interfejsu API.
Identyfikator URI punktu końcowego
Wartość {ENDPOINT_URI}
jest dostępna na stronie Przegląd witryny Azure Portal odpowiedniego zasobu usług Azure AI. Przejdź do strony Przegląd, umieść kursor nad punktem końcowym, a zostanie wyświetlona ikona Kopiuj do schowka. Skopiuj i użyj punktu końcowego w razie potrzeby.
Klucze
Wartość {API_KEY}
jest używana do uruchamiania kontenera i jest dostępna na stronie Klucze witryny Azure Portal odpowiedniego zasobu usług Azure AI. Przejdź do strony Klucze i wybierz ikonę Kopiuj do schowka.
Ważne
Te klucze subskrypcji są używane do uzyskiwania dostępu do interfejsu API usług Azure AI. Nie udostępniaj kluczy. Przechowuj je bezpiecznie. Na przykład użyj usługi Azure Key Vault. Zalecamy również regularne ponowne generowanie tych kluczy. Tylko jeden klucz jest wymagany do wykonania wywołania interfejsu API. Podczas ponownego generowania pierwszego klucza można użyć drugiego klucza w celu dalszego dostępu do usługi.
Wymagania i zalecenia dotyczące komputera hosta
Host to komputer oparty na architekturze x64 z uruchomionym kontenerem platformy Docker. Może to być komputer lokalny lub usługa hostingu platformy Docker na platformie Azure, taka jak:
- Azure Kubernetes Service.
- Azure Container Instances.
- Klaster Kubernetes wdrożony w usłudze Azure Stack. Aby uzyskać więcej informacji, zobacz Wdrażanie rozwiązania Kubernetes w usłudze Azure Stack.
W poniższej tabeli opisano minimalne i zalecane specyfikacje dla dostępnego kontenera. Każdy rdzeń procesora CPU musi być co najmniej 2,6 gigahertz (GHz) lub szybszy.
Zaleca się posiadanie procesora CPU z zestawem instrukcji AVX-512, aby uzyskać najlepsze środowisko (wydajność i dokładność).
Minimalna specyfikacja hosta | Zalecane specyfikacje hosta | |
---|---|---|
Wykrywanie danych pii | 1 rdzeń, 2 GB pamięci | 4 rdzenie, 8 GB pamięci |
Rdzenie procesora CPU i pamięć odpowiadają --cpus
ustawieniu i --memory
, które są używane w ramach docker run
polecenia .
Pobieranie obrazu kontenera za pomocą polecenia docker pull
Obraz kontenera wykrywania piI można znaleźć w mcr.microsoft.com
syndykacie rejestru kontenerów. Znajduje się on w azure-cognitive-services/textanalytics/
repozytorium i ma nazwę pii
. W pełni kwalifikowana nazwa obrazu kontenera to: mcr.microsoft.com/azure-cognitive-services/textanalytics/pii
Aby użyć najnowszej wersji kontenera, możesz użyć tagu latest
, który jest przeznaczony dla języka angielskiego. Możesz również znaleźć pełną listę kontenerów dla obsługiwanych języków przy użyciu tagów w mcR.
Najnowszy kontener wykrywania danych pii jest dostępny w kilku językach. Aby pobrać kontener dla kontenera języka angielskiego, użyj poniższego polecenia.
docker pull mcr.microsoft.com/azure-cognitive-services/textanalytics/pii:latest
Napiwek
Możesz użyć polecenia docker images , aby wyświetlić listę pobranych obrazów kontenerów. Na przykład następujące polecenie wyświetla identyfikator, repozytorium i tag każdego pobranego obrazu kontenera sformatowane jako tabela:
docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"
IMAGE ID REPOSITORY TAG
<image-id> <repository-path/name> <tag-name>
Uruchamianie kontenera za pomocą polecenia docker run
Gdy kontener znajduje się na komputerze hosta, użyj polecenia docker run , aby uruchomić kontenery. Kontener będzie nadal działać do momentu jego zatrzymania. Zastąp symbole zastępcze poniżej własnymi wartościami:
Ważne
- Polecenia platformy Docker w poniższych sekcjach używają ukośnika odwrotnego ,
\
jako znaku kontynuacji wiersza. Zastąp lub usuń to na podstawie wymagań systemu operacyjnego hosta. - Aby
Eula
uruchomić kontener, należy określić opcje ,Billing
iApiKey
. W przeciwnym razie kontener nie zostanie uruchomiony. Aby uzyskać więcej informacji, zobacz Rozliczenia.
Aby uruchomić kontener wykrywania danych pii, wykonaj następujące docker run
polecenie. Zastąp symbole zastępcze poniżej własnymi wartościami:
Symbol zastępczy | Wartość | Formatowanie lub przykład |
---|---|---|
{API_KEY} | Klucz zasobu Language. Możesz go znaleźć na stronie Klucz i punkt końcowy zasobu w witrynie Azure Portal. | xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx |
{ENDPOINT_URI} | Punkt końcowy umożliwiający uzyskiwanie dostępu do interfejsu API. Możesz go znaleźć na stronie Klucz i punkt końcowy zasobu w witrynie Azure Portal. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{IMAGE_TAG} | Tag obrazu reprezentujący język kontenera, który chcesz uruchomić. Upewnij się, że jest to zgodne z użytym poleceniem docker pull . |
latest |
docker run --rm -it -p 5000:5000 --memory 8g --cpus 1 \
mcr.microsoft.com/azure-cognitive-services/textanalytics/pii:{IMAGE_TAG} \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}
To polecenie:
- Uruchamia kontener wykrywania danych użytkownika z obrazu kontenera
- Przydziela jeden rdzeń procesora CPU i 8 gigabajtów pamięci (GB)
- Uwidacznia port TCP 5000 i przydziela pseudo-TTY dla kontenera
- Automatycznie usuwa kontener po jego zakończeniu. Obraz kontenera jest nadal dostępny na komputerze hosta.
Uruchamianie wielu kontenerów na tym samym hoście
Jeśli zamierzasz uruchomić wiele kontenerów z uwidocznionych portów, upewnij się, że każdy kontener ma inny uwidoczniony port. Na przykład uruchom pierwszy kontener na porcie 5000 i drugi kontener na porcie 5001.
Ten kontener i inny kontener usług Azure AI mogą być uruchomione razem na hoście. Można również mieć wiele kontenerów tego samego kontenera usług Azure AI, na których działa.
Wykonywanie zapytania dotyczącego punktu końcowego przewidywania kontenera
Kontener udostępnia oparte na interfejsie REST interfejsy API punktu końcowego przewidywania zapytań.
Użyj hosta http://localhost:5000
dla interfejsów API kontenera.
Sprawdzanie, czy kontener jest uruchomiony
Istnieje kilka sposobów sprawdzania, czy kontener jest uruchomiony. Znajdź zewnętrzny adres IP i uwidoczniony port danego kontenera i otwórz ulubioną przeglądarkę internetową. Użyj różnych adresów URL żądań, które są zgodne z instrukcjami, aby sprawdzić, czy kontener jest uruchomiony. Przykładowe adresy URL żądań wymienione w tym miejscu to http://localhost:5000
, ale określony kontener może się różnić. Upewnij się, że korzystasz z zewnętrznego adresu IP kontenera i uwidocznij port.
Adres URL żądania | Purpose |
---|---|
http://localhost:5000/ |
Kontener zawiera stronę główną. |
http://localhost:5000/ready |
Żądany przy użyciu polecenia GET ten adres URL zapewnia weryfikację, że kontener jest gotowy do akceptowania zapytania względem modelu. To żądanie może służyć do sond gotowości i gotowości platformy Kubernetes. |
http://localhost:5000/status |
Ten adres URL sprawdza również, czy klucz api-key używany do uruchamiania kontenera jest prawidłowy bez powodowania zapytania punktu końcowego. To żądanie może służyć do sond gotowości i gotowości platformy Kubernetes. |
http://localhost:5000/swagger |
Kontener zawiera pełen zestaw dokumentacji dla punktów końcowych oraz funkcję Wypróbuj. Dzięki tej funkcji możesz wprowadzić ustawienia w formularzu HTML opartym na sieci Web i utworzyć zapytanie bez konieczności pisania kodu. Po powrocie zapytania zostanie udostępnione przykładowe polecenie CURL, aby zademonstrować wymagane nagłówki HTTP i format treści. |
Aby uzyskać informacje na temat sposobu wywoływania danych osobowych, zobacz nasz przewodnik.
Uruchamianie kontenera odłączonego od Internetu
Aby użyć tego kontenera odłączonego od Internetu, musisz najpierw zażądać dostępu, wypełniając aplikację i kupując plan zobowiązania. Aby uzyskać więcej informacji, zobacz Use Docker containers in disconnected environments (Używanie kontenerów platformy Docker w środowiskach bez połączenia).
Jeśli kontener został zatwierdzony do uruchomienia kontenera odłączonego od Internetu, użyj poniższego przykładu pokazującego formatowanie używanego docker run
polecenia z wartościami zastępczymi. Zastąp te wartości zastępcze własnymi wartościami.
Parametr DownloadLicense=True
w poleceniu docker run
pobierze plik licencji, który umożliwi uruchomienie kontenera platformy Docker, gdy nie jest połączony z Internetem. Zawiera również datę wygaśnięcia, po której plik licencji będzie nieprawidłowy do uruchomienia kontenera. Możesz użyć pliku licencji tylko z odpowiednim kontenerem, dla którego został zatwierdzony. Na przykład nie można użyć pliku licencji dla kontenera zamiany mowy na tekst z kontenerem analizy dokumentów.
Symbol zastępczy | Wartość | Formatowanie lub przykład |
---|---|---|
{IMAGE} |
Obraz kontenera, którego chcesz użyć. | mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice |
{LICENSE_MOUNT} |
Ścieżka, w której zostanie pobrana licencja, i zainstalowana. | /host/license:/path/to/license/directory |
{ENDPOINT_URI} |
Punkt końcowy do uwierzytelniania żądania obsługi. Możesz go znaleźć na stronie Klucz i punkt końcowy zasobu w witrynie Azure Portal. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{API_KEY} |
Klucz zasobu analiza tekstu. Możesz go znaleźć na stronie Klucz i punkt końcowy zasobu w witrynie Azure Portal. | xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx |
{CONTAINER_LICENSE_DIRECTORY} |
Lokalizacja folderu licencji w lokalnym systemie plików kontenera. | /path/to/license/directory |
docker run --rm -it -p 5000:5000 \
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Po pobraniu pliku licencji można uruchomić kontener w środowisku odłączonym. W poniższym przykładzie pokazano formatowanie docker run
polecenia, którego użyjesz, z wartościami zastępczymi. Zastąp te wartości zastępcze własnymi wartościami.
Wszędzie tam, gdzie kontener jest uruchamiany, plik licencji musi być zainstalowany w kontenerze, a lokalizacja folderu licencji w lokalnym systemie plików kontenera musi być określona za pomocą Mounts:License=
polecenia . Należy również określić instalację wyjściową, aby można było zapisywać rekordy użycia rozliczeń.
Symbol zastępczy | Wartość | Formatowanie lub przykład |
---|---|---|
{IMAGE} |
Obraz kontenera, którego chcesz użyć. | mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice |
{MEMORY_SIZE} |
Odpowiedni rozmiar pamięci do przydzielenia dla kontenera. | 4g |
{NUMBER_CPUS} |
Odpowiednia liczba procesorów CPU do przydzielenia dla kontenera. | 4 |
{LICENSE_MOUNT} |
Ścieżka, w której będzie znajdować się i instalowana licencja. | /host/license:/path/to/license/directory |
{OUTPUT_PATH} |
Ścieżka wyjściowa rejestrowania rekordów użycia. | /host/output:/path/to/output/directory |
{CONTAINER_LICENSE_DIRECTORY} |
Lokalizacja folderu licencji w lokalnym systemie plików kontenera. | /path/to/license/directory |
{CONTAINER_OUTPUT_DIRECTORY} |
Lokalizacja folderu wyjściowego w lokalnym systemie plików kontenera. | /path/to/output/directory |
docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \
-v {LICENSE_MOUNT} \
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}
Zatrzymywanie kontenera
Aby zamknąć kontener, w środowisku wiersza polecenia, w którym jest uruchomiony kontener, wybierz Ctrl+C.
Rozwiązywanie problemów
Jeśli uruchamiasz kontener z włączoną instalacją danych wyjściowych i rejestrowaniem, kontener generuje pliki dziennika, które są pomocne w rozwiązywaniu problemów występujących podczas uruchamiania lub uruchamiania kontenera.
Napiwek
Aby uzyskać więcej informacji na temat rozwiązywania problemów i wskazówek, zobacz Często zadawane pytania dotyczące kontenerów usługi Azure AI.
Rozliczenia
Kontenery wykrywania danych osobowych wysyłają informacje rozliczeniowe na platformę Azure przy użyciu zasobu języka na koncie platformy Azure.
Zapytania do kontenera są rozliczane w warstwie cenowej zasobu platformy Azure używanego dla parametru ApiKey
.
Kontenery usług AI platformy Azure nie są licencjonowane do uruchamiania bez połączenia z punktem końcowym pomiaru użytkowania ani rozliczeń. Należy zezwolić kontenerom na komunikowanie informacji rozliczeniowych z punktem końcowym rozliczeń przez cały czas. Kontenery usług AI platformy Azure nie wysyłają do firmy Microsoft danych klientów, takich jak obraz lub tekst analizowany.
Łączenie się z platformą Azure
Do uruchomienia kontenera potrzebne są wartości argumentów rozliczeniowych. Te wartości umożliwiają kontenerowi łączenie się z punktem końcowym rozliczeń. Kontener raportuje użycie co około 10 do 15 minut. Jeśli kontener nie łączy się z platformą Azure w dozwolonym przedziale czasu, kontener będzie nadal działać, ale nie obsługuje zapytań, dopóki punkt końcowy rozliczeń nie zostanie przywrócony. Próba nawiązania połączenia jest podejmowana 10 razy w tym samym przedziale czasu od 10 do 15 minut. Jeśli nie może nawiązać połączenia z punktem końcowym rozliczeń w ciągu 10 prób, kontener przestanie obsługiwać żądania. Zobacz często zadawane pytania dotyczące kontenera usług AI platformy Azure, aby uzyskać przykład informacji wysyłanych do firmy Microsoft na potrzeby rozliczeń.
Argumenty rozliczeniowe
Polecenie docker run
uruchomi kontener, gdy wszystkie trzy z następujących opcji są dostarczane z prawidłowymi wartościami:
Opcja | Opis |
---|---|
ApiKey |
Klucz interfejsu API zasobu usług Azure AI używany do śledzenia informacji rozliczeniowych. Wartość tej opcji musi być ustawiona na klucz interfejsu API dla zaaprowizowanego zasobu określonego w pliku Billing . |
Billing |
Punkt końcowy zasobu usług Azure AI używany do śledzenia informacji rozliczeniowych. Wartość tej opcji musi być ustawiona na identyfikator URI punktu końcowego aprowizowanego zasobu platformy Azure. |
Eula |
Wskazuje, że zaakceptowano licencję dla kontenera. Wartość tej opcji należy ustawić tak, aby akceptowała. |
Aby uzyskać więcej informacji na temat tych opcji, zobacz Konfigurowanie kontenerów.
Podsumowanie
W tym artykule przedstawiono pojęcia i przepływ pracy dotyczące pobierania, instalowania i uruchamiania kontenerów wykrywania danych pii. Podsumowując:
- Wykrywanie piI zapewnia kontenery systemu Linux dla platformy Docker
- Obrazy kontenerów są pobierane z usługi Microsoft Container Registry (MCR).
- Obrazy kontenerów są uruchamiane na platformie Docker.
- Podczas tworzenia wystąpienia kontenera należy określić informacje o rozliczeniach.
Ważne
Kontenery sztucznej inteligencji platformy Azure nie mają licencji na uruchamianie bez nawiązywania połączenia z platformą Azure na potrzeby pomiaru użytkowania. Klienci muszą umożliwić kontenerom komunikowanie informacji rozliczeniowych z usługą pomiarów przez cały czas. Kontenery sztucznej inteligencji platformy Azure nie wysyłają danych klienta (np. tekstu analizowanego) do firmy Microsoft.
Następne kroki
- Zobacz Konfigurowanie kontenerów pod kątem ustawień konfiguracji.