Der kognitive Skill „Spracherkennung“
Der Skill Spracherkennung erkennt die Sprache von Eingabetexten und meldet einen einzigen Sprachcode für jedes Dokument, das auf Anforderung gesendet wird. Der Sprachcode ist mit einem Wert kombiniert, der die Stärke der Analyse angibt. Dieser Skill verwendet die maschinellen Lernmodelle, die in Azure KI Language bereitgestellt werden.
Diese Funktion ist besonders nützlich, wenn Sie die Sprache des Texts als Eingabe für andere Skills (z.B. den Skill „Standpunktanalyse“ oder den Skill „Text teilen“) benötigen.
Mehr zur Sprachenerkennung finden Sie unter unterstützte Sprachen. Wenn Inhalte in einer nicht unterstützten Sprache ausgedrückt werden, ist die Antwort (Unknown)
.
Hinweis
Dieser Skill ist an Azure KI Services gebunden und erfordert eine abrechenbare Ressource für Transaktionen, die 20 Dokumente pro Indexer und Tag überschreiten. Die Ausführung integrierter Skills wird nach dem bestehenden nutzungsbasierten Preis für Azure KI Services berechnet.
@odata.type
Microsoft.Skills.Text.LanguageDetectionSkill
Datengrenzwerte
Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length
). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an den Skill für Sprachenerkennung senden, können Sie den Skill „Text teilen“ verwenden.
Skillparameter
Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.
Eingaben | Beschreibung |
---|---|
defaultCountryHint |
(Optional) Es kann ein ISO 3166-1-Alpha-2-Ländercode aus zwei Buchstaben angegeben werden, der als Hinweis für das Spracherkennungsmodell verwendet wird, wenn es die Sprache nicht eindeutig zuordnen kann. Insbesondere wird der Parameter defaultCountryHint mit Dokumenten verwendet, die die countryHint -Eingabe nicht explizit festlegen. |
modelVersion |
(Optional) Gibt die Version des Modells an, die beim Aufruf der Spracherkennung verwendet wird. Es wird standardmäßig die neueste verfügbare Version verwendet. Es wird empfohlen, diesen Wert nur anzugeben, wenn es notwendig ist. |
Skilleingaben
Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.
Eingaben | Beschreibung |
---|---|
text |
Der zu analysierende Text |
countryHint |
Ein ISO 3166-1-Alpha-2-Ländercode aus zwei Buchstaben, der als Hinweis für das Spracherkennungsmodell verwendet wird, wenn es die Sprache nicht eindeutig zuordnen kann. |
Skillausgaben
Ausgabename | Beschreibung |
---|---|
languageCode |
Der für die Sprache identifizierte ISO-6391-Sprachcode. Beispiel: „en“. |
languageName |
Der Name der Sprache. Beispiel: „Englisch“. |
score |
Ein Wert zwischen 0 und 1 ein. Die Wahrscheinlichkeit, dass die Sprache korrekt identifiziert ist. Der Wert kann kleiner als 1 sein, wenn im Satz verschiedene Sprachen kombiniert sind. |
Beispieldefinition
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/text"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "myLanguageCode"
},
{
"name": "languageName",
"targetName": "myLanguageName"
},
{
"name": "score",
"targetName": "myLanguageScore"
}
]
}
Beispieleingabe
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
},
{
"recordId": "3",
"data":
{
"text": "impossible",
"countryHint": "fr"
}
}
]
Beispielausgabe
{
"values": [
{
"recordId": "1",
"data":
{
"languageCode": "en",
"languageName": "English",
"score": 1,
}
},
{
"recordId": "2",
"data":
{
"languageCode": "es",
"languageName": "Spanish",
"score": 1,
}
},
{
"recordId": "3",
"data":
{
"languageCode": "fr",
"languageName": "French",
"score": 1,
}
}
]
}