Custom Translator — często zadawane pytania
Ten artykuł zawiera odpowiedzi na często zadawane pytania dotyczące usługi Custom Translator.
Jakie są bieżące ograniczenia w usłudze Custom Translator?
Istnieją ograniczenia i limity dotyczące rozmiaru pliku, trenowania modelu i wdrażania modelu. Pamiętaj o tych ograniczeniach podczas konfigurowania treningu w celu utworzenia modelu w usłudze Custom Translator.
- Pliki do tłumaczenia muszą mieć rozmiar mniejszy niż 100 MB.
- Dane monojęzykowe nie jest obsługiwane. Jednojęzyczny plik ma jeden język, który nie jest sparowany z innym plikiem innego języka.
Kiedy należy zażądać wdrożenia dla wytrenowanego systemu tłumaczenia?
Utworzenie optymalnego systemu tłumaczenia dla projektu może potrwać kilka szkoleń. Możesz spróbować użyć większej ilości danych treningowych lub bardziej starannie przefiltrowanych danych, jeśli BLEU
wynik i/ lub wyniki testu nie są zadowalające. Należy zachować ścisłą i staranną ostrożność podczas projektowania zestawu dostrajania i zestawu testowego. Upewnij się, że zestawy w pełni reprezentują terminologię i styl materiału, który chcesz przetłumaczyć. Możesz być bardziej liberalny w komponowaniu danych treningowych i eksperymentować z różnymi opcjami. Zażądaj wdrożenia systemu, gdy tłumaczenia w wynikach testu systemu są zadowalające i nie masz więcej danych do dodania w celu ulepszenia wytrenowanego systemu.
Ile wytrenowanych systemów można wdrożyć w projekcie?
Na projekt można wdrożyć tylko jeden wytrenowany system. Utworzenie odpowiedniego systemu tłumaczenia dla projektu może potrwać kilka szkoleń. Zachęcamy do zażądania wdrożenia szkolenia, które daje najlepszy wynik. Jakość szkolenia można określić według BLEU
wyniku (wyższa jest lepsza), a następnie skonsultować się z recenzentami przed podjęciem decyzji, że jakość tłumaczeń jest odpowiednia do wdrożenia.
Kiedy można oczekiwać wdrożenia moich szkoleń?
Wdrożenie trwa zazwyczaj mniej niż godzinę.
Jak uzyskać dostęp do wdrożonego systemu?
Dostęp do wdrożonych systemów można uzyskać za pośrednictwem interfejsu API tłumaczenia tekstu w usłudze Microsoft Translator w wersji 3, określając identyfikator CategoryID. Więcej informacji na temat interfejsu API tłumaczenia tekstu w usłudze Translator można znaleźć na stronie internetowej Dokumentacja interfejsu API.
Jak mogę pominąć wyrównanie i niezgodność zdań, jeśli moje dane są już wyrównane?
Usługa Custom Translator pomija wyrównanie zdań i niezgodność zdań dla TMX
plików i plików tekstowych .align
z rozszerzeniem . .align
pliki zapewniają użytkownikom możliwość pomijania procesu łamania zdań i wyrównania zdań w usłudze Custom Translator dla plików, które są idealnie wyrównane i nie wymagają dalszego przetwarzania. Zalecamy używanie .align
rozszerzenia tylko dla plików, które są idealnie wyrównane.
Jeśli liczba wyodrębnionych zdań nie jest zgodna z dwiema plikami o tej samej nazwie podstawowej, usługa Custom Translator uruchamia wyrównywanie zdań w .align
plikach.
Próbowano przekazać plik wymiany pamięci tłumaczenia (TMX), ale mówi się, że "przetwarzanie dokumentów nie powiodło się"
Upewnij się, że TMX jest zgodny ze specyfikacją TMX 1.4b.