Sprachunterstützung für die benutzerdefinierte Textanalyse für Gesundheit

Artikel
11/21/2024

Verwenden Sie diesen Artikel, um mehr über die Sprachen zu erfahren, die derzeit von der benutzerdefinierten Textanalyse für Gesundheit unterstützt werden.

Option „Mehrsprachig“

Mit der benutzerdefinierten Textanalyse für Gesundheit können Sie ein Modell in einer Sprache trainieren und es verwenden, um Entitäten aus Dokumenten anderer Sprachen zu extrahieren. Dieses Feature erspart Ihnen das Erstellen separater Projekte für jede Sprache und ermöglicht stattdessen das Kombinieren Ihrer Datasets in einem einzelnen Projekt, sodass Sie Ihre Projekte auf einfache Weise auf mehrere Sprachen skalieren können. Sie können Ihr Projekt vollständig mit englischen Dokumenten trainieren und es dann in folgenden Sprachen abfragen: Französisch, Deutsch, Italienisch und weitere. Sie können die mehrsprachige Option als Teil des Projekterstellungsprozesses oder später über die Projekteinstellungen aktivieren.

Sie müssen nicht für jede Sprache dieselbe Anzahl an Dokumenten hinzufügen. Sie sollten den Großteil Ihres Projekts in einer Sprache erstellen und nur wenige Dokumente in Sprachen hinzufügen, für die Sie eine nicht zufrieden stellende Leistung beobachten. Wenn Sie ein Projekt erstellen, das hauptsächlich englisch ist, und damit beginnen, es in Französisch, Deutsch und Spanisch zu testen, stellen Sie möglicherweise fest, dass Deutsch nicht so gut funktioniert wie die anderen beiden Sprachen. Ziehen Sie in diesem Fall in Betracht, 5 % Ihrer ursprünglichen englischen Dokumente auf Deutsch hinzuzufügen, ein neues Modell zu trainieren und es erneut auf Deutsch zu testen. Auf der Seite Datenbeschriftung in Language Studio können Sie die Sprache des Dokuments auswählen, das Sie hinzufügen. Für deutsche Abfragen sollten dann bessere Ergebnisse erzielt werden. Je mehr beschriftete Dokumente Sie hinzufügen, desto größer ist die Wahrscheinlichkeit, dass die Ergebnisse besser werden. Wenn Sie Daten in einer weiteren Sprache hinzufügen, brauchen Sie in der Regel nicht mit negativen Auswirkungen auf die anderen Sprachen zu rechnen.

Hebräisch wird in mehrsprachigen Projekten nicht unterstützt. Wenn die primäre Sprache des Projekts Hebräisch ist, können Sie keine Trainingsdaten in anderen Sprachen hinzufügen oder das Modell mit anderen Sprachen abfragen. Wenn die primäre Sprache des Projekts nicht Hebräisch ist, können Sie auch keine Trainingsdaten in Hebräisch hinzufügen oder das Modell in Hebräisch abfragen.

Sprachunterstützung

Die benutzerdefinierte Textanalyse für Gesundheit unterstützt .txt-Dateien in den folgenden Sprachen:

Sprache	Sprachcode
Englisch	`en`
Französisch	`fr`
Deutsch	`de`
Spanisch	`es`
Italienisch	`it`
Portugiesisch (Portugal)	`pt-pt`
Hebräisch	`he`

Freigeben über

Sprachunterstützung für die benutzerdefinierte Textanalyse für Gesundheit

Option „Mehrsprachig“

Sprachunterstützung

Nächste Schritte

Feedback

Zusätzliche Ressourcen