Die Qualifikation „Textübersetzung“ der kognitiven Suche
Die Qualifikation Textübersetzung wertet Text aus und gibt für jeden Datensatz Text zurück, der in die angegebene Zielsprache übersetzt wurde. Dieser Skill verwendet die in Azure AI Services verfügbare Textübersetzungs-API Version 3.0.
Diese Funktion ist nützlich, wenn Sie davon ausgehen, dass nicht alle Ihre Dokumente in einer einzigen Sprache vorliegen. In diesem Fall können Sie den Text vor der Indizierung für die Suche in eine einzelne Sprache normalisieren, indem Sie ihn übersetzen. Sie ist auch für Lokalisierungsanwendungsfälle nützlich, in denen Sie möglicherweise Kopien desselben Texts in mehreren Sprachen wünschen.
Die Textübersetzungs-API Version 3.0 ist ein nicht regionaler Azure AI Service, was bedeutet, dass Ihre Daten nicht garantiert in der Region bleiben, in der sich Ihre Azure AI Search-Instanz oder Ihre angefügte Azure AI Services-Ressource befindet.
Hinweis
Dieser Skill ist an Azure KI Services gebunden und erfordert eine abrechenbare Ressource für Transaktionen, die 20 Dokumente pro Indexer und Tag überschreiten. Die Ausführung integrierter Skills wird nach dem bestehenden nutzungsbasierten Preis für Azure KI Services berechnet.
Bei Verwendung dieses Skills werden alle Dokumente in der Quelle verarbeitet und als Übersetzung in Rechnung gestellt, auch wenn die Quell- und Zielsprache identisch sind. Dieses Verhalten ist nützlich für die Unterstützung mehrerer Sprachen innerhalb desselben Dokuments, kann jedoch zu unnötiger Verarbeitung führen. Zum Vermeiden unerwarteter Abrechnungsgebühren zu Dokumenten, die keine Verarbeitung benötigen, verschieben Sie sie aus dem Datenquellencontainer, bevor Sie den Skill ausführen.
@odata.type
Microsoft.Skills.Text.TranslationSkill
Datengrenzwerte
Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length
). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an die Übersetzungsqualifikation senden, denken Sie daran, die Qualifikation „Text teilen“ zu verwenden. Wenn Sie einen Textteilungs-Skill verwenden, legen Sie die Seitenlänge auf 5000 fest, um die beste Leistung zu erzielen.
Skillparameter
Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.
Eingaben | Beschreibung |
---|---|
defaultToLanguageCode | (Erforderlich) Der Sprachcode, in den Dokumente übersetzt werden sollen, für Dokumente, in denen die Zielsprache nicht explizit angegeben ist. Siehe die vollständige Liste der unterstützten Sprachen. |
defaultFromLanguageCode | (Optional) Der Sprachcode, aus dem Dokumente übersetzt werden sollen, für Dokumente, in denen die Ausgangssprache nicht explizit angegeben ist. Wenn defaultFromLanguageCode nicht angegeben ist, wird die von der Textübersetzungs-API bereitgestellte automatische Sprachenerkennung verwendet, um die Ausgangssprache zu bestimmen. Siehe die vollständige Liste der unterstützten Sprachen. |
suggestedFrom | (Optional) Der Code der Sprache, aus der Dokumente übersetzt werden sollen, wenn weder fromLanguageCode noch defaultFromLanguageCode angegeben ist und die automatische Sprachenerkennung nicht erfolgreich ausgeführt wurde. Wenn die suggestedFrom-Sprache nicht angegeben ist, wird Englisch (en) als suggestedFrom-Sprache verwendet. Siehe die vollständige Liste der unterstützten Sprachen. |
Skilleingaben
Eingabename | Beschreibung |
---|---|
text | Der zu übersetzende Text. |
toLanguageCode | Eine Zeichenfolge, die die Sprache angibt, in die der Text übersetzt werden sollte. Wenn diese Eingabe nicht angegeben ist, wird der Text mit defaultToLanguageCode übersetzt. Siehe die vollständige Liste der unterstützten Sprachen. |
fromLanguageCode | Eine Zeichenfolge, die die aktuelle Sprache des Texts angibt. Wenn dieser Parameter nicht angegeben ist, wird defaultFromLanguageCode (oder die automatische Sprachenerkennung, wenn defaultFromLanguageCode nicht angegeben ist) verwendet, um den Text zu übersetzen. Siehe die vollständige Liste der unterstützten Sprachen. |
Skillausgaben
Ausgabename | Beschreibung |
---|---|
translatedText | Das Zeichenfolgenergebnis der Textübersetzung von translatedFromLanguageCode in translatedToLanguageCode. |
translatedToLanguageCode | Eine Zeichenfolge, die den Sprachcode angibt, in den der Text übersetzt wurde. Nützlich, wenn Sie in mehrere Sprachen übersetzen und verfolgen möchten, welcher Text in welcher Sprache vorliegt. |
translatedFromLanguageCode | Eine Zeichenfolge, die den Sprachcode angibt, aus dem der Text übersetzt wurde. Nützlich, wenn Sie sich für die Option zur automatischen Spracherkennung entschieden haben, da diese Ausgabe das Ergebnis dieser Erkennung liefert. |
Beispieldefinition
{
"@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
"defaultToLanguageCode": "fr",
"suggestedFrom": "en",
"context": "/document",
"inputs": [
{
"name": "text",
"source": "/document/text"
}
],
"outputs": [
{
"name": "translatedText",
"targetName": "translatedText"
},
{
"name": "translatedFromLanguageCode",
"targetName": "translatedFromLanguageCode"
},
{
"name": "translatedToLanguageCode",
"targetName": "translatedToLanguageCode"
}
]
}
Beispieleingabe
{
"values": [
{
"recordId": "1",
"data":
{
"text": "We hold these truths to be self-evident, that all men are created equal."
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
}
]
}
Beispielausgabe
{
"values": [
{
"recordId": "1",
"data":
{
"translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
"translatedFromLanguageCode": "en",
"translatedToLanguageCode": "fr"
}
},
{
"recordId": "2",
"data":
{
"translatedText": "Nous sommes très heureux d'être avec vous.",
"translatedFromLanguageCode": "es",
"translatedToLanguageCode": "fr"
}
}
]
}
Fehler und Warnungen
Wenn Sie einen nicht unterstützten Sprachcode für die Ausgangs- oder Zielsprache angeben, wird ein Fehler generiert, und der Text wird nicht übersetzt. Wenn Ihr Text leer ist, wird eine Warnung angezeigt. Wenn Ihr Text mehr als 50.000 Zeichen umfasst, werden nur die ersten 50.000 Zeichen übersetzt und eine Warnung ausgegeben.