Der kognitive Skill „Spracherkennung“

Artikel
09/01/2024

Der Skill Spracherkennung erkennt die Sprache von Eingabetexten und meldet einen einzigen Sprachcode für jedes Dokument, das auf Anforderung gesendet wird. Der Sprachcode ist mit einem Wert kombiniert, der die Stärke der Analyse angibt. Dieser Skill verwendet die maschinellen Lernmodelle, die in Azure KI Language bereitgestellt werden.

Diese Funktion ist besonders nützlich, wenn Sie die Sprache des Texts als Eingabe für andere Skills (z.B. den Skill „Standpunktanalyse“ oder den Skill „Text teilen“) benötigen.

Mehr zur Sprachenerkennung finden Sie unter unterstützte Sprachen. Wenn Inhalte in einer nicht unterstützten Sprache ausgedrückt werden, ist die Antwort (Unknown).

Hinweis

Dieser Skill ist an Azure KI Services gebunden und erfordert eine abrechenbare Ressource für Transaktionen, die 20 Dokumente pro Indexer und Tag überschreiten. Die Ausführung integrierter Skills wird nach dem bestehenden nutzungsbasierten Preis für Azure KI Services berechnet.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

Datengrenzwerte

Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an den Skill für Sprachenerkennung senden, können Sie den Skill „Text teilen“ verwenden.

Skillparameter

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.

Eingaben	Beschreibung
`defaultCountryHint`	(Optional) Es kann ein ISO 3166-1-Alpha-2-Ländercode aus zwei Buchstaben angegeben werden, der als Hinweis für das Spracherkennungsmodell verwendet wird, wenn es die Sprache nicht eindeutig zuordnen kann. Insbesondere wird der Parameter `defaultCountryHint` mit Dokumenten verwendet, die die `countryHint`-Eingabe nicht explizit festlegen.
`modelVersion`	(Optional) Gibt die Version des Modells an, die beim Aufruf der Spracherkennung verwendet wird. Es wird standardmäßig die neueste verfügbare Version verwendet. Es wird empfohlen, diesen Wert nur anzugeben, wenn es notwendig ist.

Skilleingaben

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.

Eingaben	Beschreibung
`text`	Der zu analysierende Text
`countryHint`	Ein ISO 3166-1-Alpha-2-Ländercode aus zwei Buchstaben, der als Hinweis für das Spracherkennungsmodell verwendet wird, wenn es die Sprache nicht eindeutig zuordnen kann.

Skillausgaben

Ausgabename	Beschreibung
`languageCode`	Der für die Sprache identifizierte ISO-6391-Sprachcode. Beispiel: „en“.
`languageName`	Der Name der Sprache. Beispiel: „Englisch“.
`score`	Ein Wert zwischen 0 und 1 ein. Die Wahrscheinlichkeit, dass die Sprache korrekt identifiziert ist. Der Wert kann kleiner als 1 sein, wenn im Satz verschiedene Sprachen kombiniert sind.

Beispieldefinition

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Beispieleingabe

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

Beispielausgabe

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

Freigeben über