Stöd för sentimentanalys och åsiktsutvinningsspråk
Använd den här artikeln om du vill lära dig vilka språk som stöds av sentimentanalys och åsiktsutvinning. Både det molnbaserade API:et och Docker-containrarna stöder samma språk.
Språkstöd för attitydanalys
Totalt antal språkkoder som stöds: 94
Språk | Språkkod | Kommentar |
---|---|---|
Afrikaans | af |
|
Albanska | sq |
|
Amhariska | am |
|
Arabiska | ar |
|
Armeniska | hy |
|
Assamesiska | as |
|
Azerbajdzjanska | az |
|
Baskiska | eu |
|
Vitryska (ny) | be |
|
Bengali | bn |
|
Bosnian | bs |
|
Breton (ny) | br |
|
Bulgariska | bg |
|
Burmesiska | my |
|
Katalanska | ca |
|
Kinesiska (förenklad) | zh-hans |
zh accepterades också |
Kinesiska (traditionell) | zh-hant |
|
Kroatiska | hr |
|
Tjeckiska | cs |
|
Danska | da |
|
Nederländska | nl |
|
Engelska | en |
|
Esperanto (ny) | eo |
|
Estniska | et |
|
Filipino | fil |
|
Finska | fi |
|
Franska | fr |
|
Galiciska | gl |
|
Georgiska | ka |
|
Tyska | de |
|
Grekiska | el |
|
Gujarati | gu |
|
Hausa (ny) | ha |
|
Hebreiska | he |
|
Hindi | hi |
|
Ungerska | hu |
|
Indonesiska | id |
|
Iriska | ga |
|
Italienska | it |
|
Japanska | ja |
|
Javanesiska (ny) | jv |
|
Kannada | kn |
|
Kazakiska | kk |
|
Khmer | km |
|
Koreanska | ko |
|
Kurdiska (Kurmanji) | ku |
|
Kirgisiska | ky |
|
Laotiska | lo |
|
Latin (ny) | la |
|
Lettiska | lv |
|
Litauiska | lt |
|
Makedonska | mk |
|
Malagassiska | mg |
|
Malajiska | ms |
|
Malayalam | ml |
|
Marathi | mr |
|
Mongoliska | mn |
|
Nepali | ne |
|
Norska | no |
|
Odia | or |
|
Oromo (ny) | om |
|
Pashto | ps |
|
Persiska | fa |
|
Polska | pl |
|
Portugisiska (Portugal) | pt-PT |
pt accepterades också |
Portugisiska (Brasilien) | pt-BR |
|
Punjabi | pa |
|
Rumänska | ro |
|
Ryska | ru |
|
Sanskrit (ny) | sa |
|
Skotsk gaeliska (ny) | gd |
|
Serbiska | sr |
|
Sindhi (ny) | sd |
|
Sinhala (ny) | si |
|
Slovakiska | sk |
|
Slovenska | sl |
|
Somali | so |
|
Spanska | es |
|
Sundanese (ny) | su |
|
Swahili | sw |
|
Svenska | sv |
|
Tamilska | ta |
|
Telugu | te |
|
Thailändska | th |
|
Turkiska | tr |
|
Ukrainska | uk |
|
Urdu | ur |
|
Uiguriska | ug |
|
Uzbekiska | uz |
|
Vietnamesiska | vi |
|
Walesiska | cy |
|
Västra Frisian (ny) | fy |
|
Xhosa (ny) | xh |
|
Jiddisch (ny) | yi |
Stöd för åsiktsutvinningsspråk
Totalt antal språkkoder som stöds: 94
Språk | Språkkod | Kommentar |
---|---|---|
Afrikaans (ny) | af |
|
Albansk (ny) | sq |
|
Amharisk (ny) | am |
|
Arabiska | ar |
|
Armeniska (ny) | hy |
|
Assamese (ny) | as |
|
Azerbajdzjan (ny) | az |
|
Baskiska (ny) | eu |
|
Vitryska (ny) | be |
|
Bengali | bn |
|
Bosniska (ny) | bs |
|
Breton (ny) | br |
|
Bulgariska (ny) | bg |
|
Burmesiska (ny) | my |
|
Katalanska (ny) | ca |
|
Kinesiska (förenklad) | zh-hans |
zh accepterades också |
Kinesiska (traditionell) (ny) | zh-hant |
|
Kroatiska (ny) | hr |
|
Tjeckiska (ny) | cs |
|
Danska | da |
|
Nederländska | nl |
|
Engelska | en |
|
Esperanto (ny) | eo |
|
Estniska (ny) | et |
|
Filippinska (ny) | fil |
|
Finska | fi |
|
Franska | fr |
|
Galiciska (ny) | gl |
|
Georgisk (ny) | ka |
|
Tyska | de |
|
Grekiska | el |
|
Gujarati (ny) | gu |
|
Hausa (ny) | ha |
|
Hebreiska (ny) | he |
|
Hindi | hi |
|
Ungerska | hu |
|
Indonesiska | id |
|
Irländska (ny) | ga |
|
Italienska | it |
|
Japanska | ja |
|
Javanesiska (ny) | jv |
|
Kannada (ny) | kn |
|
Kazakiska (ny) | kk |
|
Khmer (ny) | km |
|
Koreanska | ko |
|
Kurdiska (Kurmanji) | ku |
|
Kirgizistan (ny) | ky |
|
Lao (ny) | lo |
|
Latin (ny) | la |
|
Lettiska (ny) | lv |
|
Litauiska (ny) | lt |
|
Makedonska (ny) | mk |
|
Malagasy (ny) | mg |
|
Malay (ny) | ms |
|
Malayalam (ny) | ml |
|
Marathi | mr |
|
Mongoliska (ny) | mn |
|
Nepali (ny) | ne |
|
Norska | no |
|
Odia (ny) | or |
|
Oromo (ny) | om |
|
Pashto (ny) | ps |
|
Persiska (ny) | fa |
|
Polska | pl |
|
Portugisiska (Portugal) | pt-PT |
pt accepterades också |
Portugisiska (Brasilien) | pt-BR |
|
Punjabi (ny) | pa |
|
Rumänska (ny) | ro |
|
Ryska | ru |
|
Sanskrit (ny) | sa |
|
Skotsk gaeliska (ny) | gd |
|
Serbiska (ny) | sr |
|
Sindhi (ny) | sd |
|
Sinhala (ny) | si |
|
Slovakiska (ny) | sk |
|
Slovenska (ny) | sl |
|
Somaliska (ny) | so |
|
Spanska | es |
|
Sundanese (ny) | su |
|
Swahili (ny) | sw |
|
Svenska | sv |
|
Tamilska | ta |
|
Telugu | te |
|
Thai (ny) | th |
|
Turkiska | tr |
|
Ukrainska (ny) | uk |
|
Urdu (ny) | ur |
|
Uiguriska (ny) | ug |
|
Uzbekiska (ny) | uz |
|
Vietnamesiska (ny) | vi |
|
Walesiska (ny) | cy |
|
Västra Frisian (ny) | fy |
|
Xhosa (ny) | xh |
|
Jiddisch (ny) | yi |
Flerspråkigt alternativ (endast anpassad attitydanalys)
Med anpassad attitydanalys kan du träna en modell på ett språk och använda för att klassificera dokument på ett annat språk. Den här funktionen är användbar eftersom den hjälper till att spara tid och arbete. I stället för att skapa separata projekt för varje språk kan du hantera flerspråkig datauppsättning i ett projekt. Datamängden behöver inte vara helt på samma språk, men du bör aktivera flerspråkiga alternativ för projektet när du skapar eller senare i projektinställningarna. Om du märker att din modell presterar dåligt på vissa språk under utvärderingsprocessen kan du överväga att lägga till mer data på dessa språk i träningsuppsättningen.
Du kan träna projektet helt med engelska dokument och fråga det i: franska, tyska, mandarin, japanska, koreanska och andra. Anpassad attitydanalys gör det enkelt för dig att skala dina projekt till flera språk med hjälp av flerspråkig teknik för att träna dina modeller.
När du upptäcker att ett visst språk inte fungerar lika bra som andra språk kan du lägga till fler dokument för det språket i projektet.
Du förväntas inte lägga till samma antal dokument för varje språk. Du bör skapa större delen av projektet på ett språk och bara lägga till några dokument på språk som du ser inte fungerar bra. Om du skapar ett projekt som främst är på engelska och börjar testa det på franska, tyska och spanska kan du observera att tyska inte fungerar lika bra som de andra två språken. I så fall bör du överväga att lägga till 5 % av dina ursprungliga engelska dokument på tyska, träna en ny modell och testa på tyska igen. Du bör se bättre resultat för tyska frågor. Ju mer märkta dokument du lägger till, desto mer sannolikt blir resultatet bättre.
När du lägger till data på ett annat språk bör du inte förvänta dig att det påverkar andra språk negativt.
Nästa steg
- hur du anropar API :et för mer information.
- Snabbstart: Använda klientbiblioteket för Sentiment Analysis och REST API