Dela via


Stöd för sentimentanalys och åsiktsutvinningsspråk

Använd den här artikeln om du vill lära dig vilka språk som stöds av sentimentanalys och åsiktsutvinning. Både det molnbaserade API:et och Docker-containrarna stöder samma språk.

Språkstöd för attitydanalys

Totalt antal språkkoder som stöds: 94

Språk Språkkod Kommentar
Afrikaans af
Albanska sq
Amhariska am
Arabiska ar
Armeniska hy
Assamesiska as
Azerbajdzjanska az
Baskiska eu
Vitryska (ny) be
Bengali bn
Bosnian bs
Breton (ny) br
Bulgariska bg
Burmesiska my
Katalanska ca
Kinesiska (förenklad) zh-hans zh accepterades också
Kinesiska (traditionell) zh-hant
Kroatiska hr
Tjeckiska cs
Danska da
Nederländska nl
Engelska en
Esperanto (ny) eo
Estniska et
Filipino fil
Finska fi
Franska fr
Galiciska gl
Georgiska ka
Tyska de
Grekiska el
Gujarati gu
Hausa (ny) ha
Hebreiska he
Hindi hi
Ungerska hu
Indonesiska id
Iriska ga
Italienska it
Japanska ja
Javanesiska (ny) jv
Kannada kn
Kazakiska kk
Khmer km
Koreanska ko
Kurdiska (Kurmanji) ku
Kirgisiska ky
Laotiska lo
Latin (ny) la
Lettiska lv
Litauiska lt
Makedonska mk
Malagassiska mg
Malajiska ms
Malayalam ml
Marathi mr
Mongoliska mn
Nepali ne
Norska no
Odia or
Oromo (ny) om
Pashto ps
Persiska fa
Polska pl
Portugisiska (Portugal) pt-PT pt accepterades också
Portugisiska (Brasilien) pt-BR
Punjabi pa
Rumänska ro
Ryska ru
Sanskrit (ny) sa
Skotsk gaeliska (ny) gd
Serbiska sr
Sindhi (ny) sd
Sinhala (ny) si
Slovakiska sk
Slovenska sl
Somali so
Spanska es
Sundanese (ny) su
Swahili sw
Svenska sv
Tamilska ta
Telugu te
Thailändska th
Turkiska tr
Ukrainska uk
Urdu ur
Uiguriska ug
Uzbekiska uz
Vietnamesiska vi
Walesiska cy
Västra Frisian (ny) fy
Xhosa (ny) xh
Jiddisch (ny) yi

Stöd för åsiktsutvinningsspråk

Totalt antal språkkoder som stöds: 94

Språk Språkkod Kommentar
Afrikaans (ny) af
Albansk (ny) sq
Amharisk (ny) am
Arabiska ar
Armeniska (ny) hy
Assamese (ny) as
Azerbajdzjan (ny) az
Baskiska (ny) eu
Vitryska (ny) be
Bengali bn
Bosniska (ny) bs
Breton (ny) br
Bulgariska (ny) bg
Burmesiska (ny) my
Katalanska (ny) ca
Kinesiska (förenklad) zh-hans zh accepterades också
Kinesiska (traditionell) (ny) zh-hant
Kroatiska (ny) hr
Tjeckiska (ny) cs
Danska da
Nederländska nl
Engelska en
Esperanto (ny) eo
Estniska (ny) et
Filippinska (ny) fil
Finska fi
Franska fr
Galiciska (ny) gl
Georgisk (ny) ka
Tyska de
Grekiska el
Gujarati (ny) gu
Hausa (ny) ha
Hebreiska (ny) he
Hindi hi
Ungerska hu
Indonesiska id
Irländska (ny) ga
Italienska it
Japanska ja
Javanesiska (ny) jv
Kannada (ny) kn
Kazakiska (ny) kk
Khmer (ny) km
Koreanska ko
Kurdiska (Kurmanji) ku
Kirgizistan (ny) ky
Lao (ny) lo
Latin (ny) la
Lettiska (ny) lv
Litauiska (ny) lt
Makedonska (ny) mk
Malagasy (ny) mg
Malay (ny) ms
Malayalam (ny) ml
Marathi mr
Mongoliska (ny) mn
Nepali (ny) ne
Norska no
Odia (ny) or
Oromo (ny) om
Pashto (ny) ps
Persiska (ny) fa
Polska pl
Portugisiska (Portugal) pt-PT pt accepterades också
Portugisiska (Brasilien) pt-BR
Punjabi (ny) pa
Rumänska (ny) ro
Ryska ru
Sanskrit (ny) sa
Skotsk gaeliska (ny) gd
Serbiska (ny) sr
Sindhi (ny) sd
Sinhala (ny) si
Slovakiska (ny) sk
Slovenska (ny) sl
Somaliska (ny) so
Spanska es
Sundanese (ny) su
Swahili (ny) sw
Svenska sv
Tamilska ta
Telugu te
Thai (ny) th
Turkiska tr
Ukrainska (ny) uk
Urdu (ny) ur
Uiguriska (ny) ug
Uzbekiska (ny) uz
Vietnamesiska (ny) vi
Walesiska (ny) cy
Västra Frisian (ny) fy
Xhosa (ny) xh
Jiddisch (ny) yi

Flerspråkigt alternativ (endast anpassad attitydanalys)

Med anpassad attitydanalys kan du träna en modell på ett språk och använda för att klassificera dokument på ett annat språk. Den här funktionen är användbar eftersom den hjälper till att spara tid och arbete. I stället för att skapa separata projekt för varje språk kan du hantera flerspråkig datauppsättning i ett projekt. Datamängden behöver inte vara helt på samma språk, men du bör aktivera flerspråkiga alternativ för projektet när du skapar eller senare i projektinställningarna. Om du märker att din modell presterar dåligt på vissa språk under utvärderingsprocessen kan du överväga att lägga till mer data på dessa språk i träningsuppsättningen.

Du kan träna projektet helt med engelska dokument och fråga det i: franska, tyska, mandarin, japanska, koreanska och andra. Anpassad attitydanalys gör det enkelt för dig att skala dina projekt till flera språk med hjälp av flerspråkig teknik för att träna dina modeller.

När du upptäcker att ett visst språk inte fungerar lika bra som andra språk kan du lägga till fler dokument för det språket i projektet.

Du förväntas inte lägga till samma antal dokument för varje språk. Du bör skapa större delen av projektet på ett språk och bara lägga till några dokument på språk som du ser inte fungerar bra. Om du skapar ett projekt som främst är på engelska och börjar testa det på franska, tyska och spanska kan du observera att tyska inte fungerar lika bra som de andra två språken. I så fall bör du överväga att lägga till 5 % av dina ursprungliga engelska dokument på tyska, träna en ny modell och testa på tyska igen. Du bör se bättre resultat för tyska frågor. Ju mer märkta dokument du lägger till, desto mer sannolikt blir resultatet bättre.

När du lägger till data på ett annat språk bör du inte förvänta dig att det påverkar andra språk negativt.

Nästa steg