Sprachunterstützung für Stimmungsanalyse und Opinion Mining
In diesem Artikel erfahren Sie, welche natürlichen Sprachen von Stimmungsanalyse und Opinion Mining unterstützt werden. Sowohl die cloudbasierte API als auch Docker-Container unterstützen dieselben Sprachen.
Sprachunterstützung für Stimmungsanalyse
Gesamtzahl der unterstützten Sprachcodes: 94
Sprache | Sprachcode | Hinweise |
---|---|---|
Afrikaans | af |
|
Albanisch | sq |
|
Amharisch | am |
|
Arabisch | ar |
|
Armenisch | hy |
|
Assamesisch | as |
|
Aserbaidschanisch | az |
|
Baskisch | eu |
|
Belarussisch (neu) | be |
|
Bengali | bn |
|
Bosnisch | bs |
|
Bretonisch (neu) | br |
|
Bulgarisch | bg |
|
Birmanisch | my |
|
Katalanisch | ca |
|
Chinesisch (vereinfacht) | zh-hans |
zh wird ebenfalls akzeptiert. |
Chinesisch (traditionell) | zh-hant |
|
Kroatisch | hr |
|
Tschechisch | cs |
|
Dänisch | da |
|
Niederländisch | nl |
|
Englisch | en |
|
Esperanto (neu) | eo |
|
Estnisch | et |
|
Filipino | fil |
|
Finnisch | fi |
|
Französisch | fr |
|
Galizisch | gl |
|
Georgisch | ka |
|
Deutsch | de |
|
Griechisch | el |
|
Gujarati | gu |
|
Hausa (neu) | ha |
|
Hebräisch | he |
|
Hindi | hi |
|
Ungarisch | hu |
|
Indonesisch | id |
|
Irisch | ga |
|
Italienisch | it |
|
Japanisch | ja |
|
Javanisch (neu) | jv |
|
Kannada | kn |
|
Kasachisch | kk |
|
Khmer | km |
|
Koreanisch | ko |
|
Kurdisch (Kurmanji) | ku |
|
Kirgisisch | ky |
|
Laotisch | lo |
|
Lateinisch (neu) | la |
|
Lettisch | lv |
|
Litauisch | lt |
|
Mazedonisch | mk |
|
Madagassisch | mg |
|
Malaiisch | ms |
|
Malayalam | ml |
|
Marathi | mr |
|
Mongolisch | mn |
|
Nepalesisch | ne |
|
Norwegisch | no |
|
Odia | or |
|
Oromo (neu) | om |
|
Paschtu | ps |
|
Persisch | fa |
|
Polnisch | pl |
|
Portugiesisch (Portugal) | pt-PT |
pt wird ebenfalls akzeptiert. |
Portugiesisch (Brasilien) | pt-BR |
|
Pandschabi | pa |
|
Rumänisch | ro |
|
Russisch | ru |
|
Sanskrit (neu) | sa |
|
Schottisches Gälisch (neu) | gd |
|
Serbisch | sr |
|
Sindhi (neu) | sd |
|
Sinhala (neu) | si |
|
Slowakisch | sk |
|
Slowenisch | sl |
|
Somali | so |
|
Spanisch | es |
|
Sundanesisch (neu) | su |
|
Suaheli | sw |
|
Schwedisch | sv |
|
Tamilisch | ta |
|
Telugu | te |
|
Thailändisch | th |
|
Türkisch | tr |
|
Ukrainisch | uk |
|
Urdu | ur |
|
Uigurisch | ug |
|
Usbekisch | uz |
|
Vietnamesisch | vi |
|
Walisisch | cy |
|
Westfriesisch (neu) | fy |
|
Xhosa (neu) | xh |
|
Jiddisch (neu) | yi |
Sprachunterstützung für Opinion Mining
Gesamtzahl der unterstützten Sprachcodes: 94
Sprache | Sprachcode | Hinweise |
---|---|---|
Afrikaans (neu) | af |
|
Albanisch (neu) | sq |
|
Amharisch (neu) | am |
|
Arabisch | ar |
|
Armenisch (neu) | hy |
|
Assamesisch (neu) | as |
|
Aserbaidschanisch (neu) | az |
|
Baskisch (neu) | eu |
|
Belarussisch (neu) | be |
|
Bengali | bn |
|
Bosnisch (neu) | bs |
|
Bretonisch (neu) | br |
|
Bulgarisch (neu) | bg |
|
Birmanisch (neu) | my |
|
Katalanisch (neu) | ca |
|
Chinesisch (vereinfacht) | zh-hans |
zh wird ebenfalls akzeptiert. |
Chinesisch (traditionell) (neu) | zh-hant |
|
Kroatisch (neu) | hr |
|
Tschechisch (neu) | cs |
|
Dänisch | da |
|
Niederländisch | nl |
|
Englisch | en |
|
Esperanto (neu) | eo |
|
Estnisch (neu) | et |
|
Filipino (neu) | fil |
|
Finnisch | fi |
|
Französisch | fr |
|
Galizisch (neu) | gl |
|
Georgisch (neu) | ka |
|
Deutsch | de |
|
Griechisch | el |
|
Gujarati (neu) | gu |
|
Hausa (neu) | ha |
|
Hebräisch (neu) | he |
|
Hindi | hi |
|
Ungarisch | hu |
|
Indonesisch | id |
|
Irisch (neu) | ga |
|
Italienisch | it |
|
Japanisch | ja |
|
Javanisch (neu) | jv |
|
Kannada (neu) | kn |
|
Kasachisch (neu) | kk |
|
Khmer (neu) | km |
|
Koreanisch | ko |
|
Kurdisch (Kurmanji) | ku |
|
Kirgisisch (neu) | ky |
|
Lao (neu) | lo |
|
Lateinisch (neu) | la |
|
Lettisch (neu) | lv |
|
Litauisch (neu) | lt |
|
Mazedonisch (neu) | mk |
|
Madagassisch (neu) | mg |
|
Malaiisch (neu) | ms |
|
Malayalam (neu) | ml |
|
Marathi | mr |
|
Mongolisch (neu) | mn |
|
Nepalesisch (neu) | ne |
|
Norwegisch | no |
|
Odia (neu) | or |
|
Oromo (neu) | om |
|
Paschtu (neu) | ps |
|
Persisch (neu) | fa |
|
Polnisch | pl |
|
Portugiesisch (Portugal) | pt-PT |
pt wird ebenfalls akzeptiert. |
Portugiesisch (Brasilien) | pt-BR |
|
Punjabi (neu) | pa |
|
Rumänisch (neu) | ro |
|
Russisch | ru |
|
Sanskrit (neu) | sa |
|
Schottisches Gälisch (neu) | gd |
|
Serbisch (neu) | sr |
|
Sindhi (neu) | sd |
|
Sinhala (neu) | si |
|
Slowakisch (neu) | sk |
|
Slowenisch (neu) | sl |
|
Somali (neu) | so |
|
Spanisch | es |
|
Sundanesisch (neu) | su |
|
Suaheli (neu) | sw |
|
Schwedisch | sv |
|
Tamilisch | ta |
|
Telugu | te |
|
Thailändisch (neu) | th |
|
Türkisch | tr |
|
Ukrainisch (neu) | uk |
|
Urdu (neu) | ur |
|
Uigurisch (neu) | ug |
|
Usbekisch (neu) | uz |
|
Vietnamesisch (neu) | vi |
|
Walisisch (neu) | cy |
|
Westfriesisch (neu) | fy |
|
Xhosa (neu) | xh |
|
Jiddisch (neu) | yi |
Mehrsprachige Option (nur benutzerdefinierte Stimmungsanalyse)
Mit der benutzerdefinierten Stimmungsanalyse können Sie ein Modell in einer Sprache trainieren und Dokumente in einer anderen Sprache klassifizieren. Dieses Feature ist nützlich, da Sie damit Zeit und Aufwand sparen. Anstelle separate Projekte für jede Sprache erstellen zu müssen, können Sie ein mehrsprachiges Dataset in einem Projekt verwenden. Ihr Dataset muss nicht vollständig in einer Sprache sein, Sie sollten jedoch während der Erstellung die Option für mehrere Sprachen für Ihr Projekt aktivieren oder dies später in den Projekteinstellungen nachholen. Wenn Sie während des Auswertungsprozesses feststellen, dass Ihr Modell in bestimmten Sprachen eine schlechte Leistung aufweist, sollten Sie Ihrem Trainingssatz weitere Daten in den betreffenden Sprachen hinzufügen.
Sie können Ihr Projekt vollständig mit englischen Dokumenten trainieren und es dann in folgenden Sprachen abfragen: Französisch, Deutsch, Mandarin, Japanisch, Koreanisch und weiteren. Mithilfe der benutzerdefinierten Stimmungsanalyse können Sie Ihre Projekte auf einfache Weise auf mehrere Sprachen skalieren, indem Sie Mehrsprachentechnologie zum Trainieren Ihrer Modelle verwenden.
Wenn Sie feststellen, dass eine bestimmte Sprache nicht so gut funktioniert wie andere Sprachen, können Sie Ihrem Projekt weitere Dokumente für diese Sprache hinzufügen.
Sie müssen nicht für jede Sprache dieselbe Anzahl an Dokumenten hinzufügen. Sie sollten den Großteil Ihres Projekts in einer Sprache erstellen und nur wenige Dokumente in Sprachen hinzufügen, für die Sie eine nicht zufrieden stellende Leistung beobachten. Wenn Sie ein Projekt erstellen, das hauptsächlich englisch ist, und damit beginnen, es in Französisch, Deutsch und Spanisch zu testen, stellen Sie möglicherweise fest, dass Deutsch nicht so gut funktioniert wie die anderen beiden Sprachen. Ziehen Sie in diesem Fall in Betracht, 5 % Ihrer ursprünglichen englischen Dokumente auf Deutsch hinzuzufügen, ein neues Modell zu trainieren und es erneut auf Deutsch zu testen. Für deutsche Abfragen sollten dann bessere Ergebnisse erzielt werden. Je mehr beschriftete Dokumente Sie hinzufügen, desto größer ist die Wahrscheinlichkeit, dass die Ergebnisse besser werden.
Wenn Sie Daten in einer weiteren Sprache hinzufügen, brauchen Sie in der Regel nicht mit negativen Auswirkungen auf die anderen Sprachen zu rechnen.