Co to jest tłumaczenie wideo (wersja zapoznawcza)
Uwaga
Ta funkcja jest obecnie w publicznej wersji zapoznawczej. Ta wersja zapoznawcza jest udostępniana bez umowy dotyczącej poziomu usług i nie zalecamy korzystania z niej w przypadku obciążeń produkcyjnych. Niektóre funkcje mogą być nieobsługiwane lub ograniczone. Aby uzyskać więcej informacji, zobacz Uzupełniające warunki korzystania z wersji zapoznawczych platformy Microsoft Azure.
Tłumaczenie wideo to funkcja w usłudze Azure AI Speech, która umożliwia bezproblemowe tłumaczenie i generowanie filmów wideo w wielu językach automatycznie. Ta funkcja została zaprojektowana w celu ułatwienia lokalizowania zawartości wideo w celu zaspokojenia różnorodnych odbiorców na całym świecie. Możesz wydajnie tworzyć immersywne, zlokalizowane filmy wideo w różnych przypadkach użycia, takich jak vlogi, edukacja, wiadomości, szkolenia dla przedsiębiorstw, reklama, film, programy telewizyjne i inne.
Proces zastępowania oryginalnego języka wideo audio nagranym w innym języku jest często polegał na zaspokajaniu różnych odbiorców. Tradycyjnie osiągane za pomocą rejestrowania ludzkiego i ręcznego poprodukcyjnego tłumaczenie jest niezbędne do zapewnienia, że widzowie mogą korzystać z zawartości wideo w ich języku ojczystym. Jednak ten proces ma kluczowe punkty bólu, w tym jego wysoki koszt, długi czas trwania i niezdolność do dokładnego replikowania głosu oryginalnego głośnika. Tłumaczenie wideo w usłudze Azure AI Speech rozwiązuje te wyzwania, zapewniając zautomatyzowane, wydajne i ekonomiczne rozwiązanie do tworzenia zlokalizowanych filmów wideo.
Przypadek użycia
Tłumaczenie wideo udostępniane przez usługę Azure AI Speech oferuje szeroką gamę przypadków użycia w różnych branżach i typach zawartości. Oto kilka kluczowych aplikacji:
Wiadomości i wywiady: Organizacje informacyjne mogą tłumaczyć i dubować segmenty wiadomości i wywiady w celu zapewnienia dokładnych i terminowych informacji dla odbiorców na całym świecie.
Reklama i marketing: Firmy mogą lokalizować swoje reklamy i filmy marketingowe, aby rezonować z docelowymi odbiorcami na różnych rynkach, zwiększając świadomość marki i zaangażowanie klientów.
Edukacja i nauka: Instytucje edukacyjne i platformy uczenia elektronicznego mogą nazwać swoje filmy instruktażowe i wykłady w różnych językach, dzięki czemu uczenie się jest bardziej dostępne i inkluzywne.
Film + tv show: Studia filmowe i firmy produkcyjne mogą nazwać swoje filmy i programy telewizyjne do dystrybucji międzynarodowej, osiągając szerszą publiczność i maksymalizując potencjał przychodów.
Vlog + krótkie wideo: Właściciele zawartości mogą łatwo tłumaczyć i dubbować swoje vlogi i krótkie filmy, aby dotrzeć do międzynarodowych odbiorców, rozszerzając ich oglądalność i zaangażowanie.
Szkolenia dla przedsiębiorstw: Korporacje mogą lokalizować swoje filmy szkoleniowe dla pracowników w różnych regionach, zapewniając spójną i skuteczną komunikację między pracownikami.
Obsługiwane regiony i języki
Obecnie tłumaczenie wideo w usłudze Azure AI Speech jest obsługiwane tylko w regionie Wschodnie stany USA.
Obsługujemy tłumaczenie wideo między różnymi językami, umożliwiając dostosowanie zawartości do określonych preferencji językowych. W przypadku języków obsługiwanych do tłumaczenia wideo zapoznaj się z obsługiwanymi językami źródłowymi i docelowymi.
Podstawowe funkcje
Wyodrębnianie dźwięku dialogowego i transkrypcja zawartości mówionej.
Automatycznie wyodrębnia dźwięk dialogowy ze źródłowego wideo i transkrybuje zawartość mówionej.
Tłumaczenie z języka A na B i duże formatowanie modelu językowego (LLM).
Tłumaczy transkrypcji zawartość z oryginalnego języka (Language A) na język docelowy (Language B) przy użyciu zaawansowanych technik przetwarzania języka. Zwiększa jakość tłumaczenia i udoskonala przetłumaczony tekst ze względu na płeć za pomocą reformowania LLM.
Tłumaczenie automatyczne — generowanie głosu w innym języku.
Korzysta z technologii zamiany tekstu na mowę opartej na sztucznej inteligencji, aby automatycznie generować głosy podobne do człowieka w języku docelowym. Te głosy są dokładnie synchronizowane z wideo, zapewniając nieskazitelne środowisko tłumaczenia. Obejmuje to wykorzystanie wstępnie utworzonych neuronowych głosów na potrzeby wysokiej jakości danych wyjściowych i oferuje opcje dla głosu osobistego.
Człowiek w pętli do edycji zawartości.
Umożliwia interwencję człowieka w celu przejrzenia i edytowania przetłumaczonej zawartości, zapewnienia dokładności i odpowiedniości kulturowej przed sfinalizowaniem nazwanego filmu wideo.
Generowanie napisów.
Dostarcza w pełni nazwany film wideo z przetłumaczonym dialogiem, zsynchronizowanymi napisami i wygenerowanymi głosami, gotowymi do pobrania i dystrybucji na różnych platformach. Można również ustawić długość podtytułu na każdym ekranie, aby uzyskać optymalny ekran.
Rozpocznij
Aby rozpocząć tłumaczenie wideo, zapoznaj się z tłumaczeniem wideo w studio. Interfejs API tłumaczenia wideo będzie dostępny wkrótce.
Cena
Aby uzyskać szczegółowe informacje na temat tłumaczenia wideo, zobacz Cennik usługi Mowa. Należy pamiętać, że cennik tłumaczenia wideo będzie widoczny tylko dla regionów usługi, w których funkcja jest dostępna.