你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

情绪分析和观点挖掘的语言支持

使用本文了解情绪分析和观点挖掘支持哪些语言。 基于云的 API 和 Docker 容器都支持相同的语言。

情绪分析的语言支持

支持的语言代码总数:94

语言 语言代码 说明
南非荷兰语 af
阿尔巴尼亚语 sq
阿姆哈拉语 am
阿拉伯语 ar
亚美尼亚语 hy
阿萨姆语 as
阿塞拜疆语 az
巴斯克语 eu
白俄罗斯语(新) be
孟加拉语 bn
波斯尼亚语 bs
布列塔尼语(新) br
保加利亚语 bg
缅甸语 my
加泰罗尼亚语 ca
中文(简体) zh-hans zh 也接受
中文(繁体) zh-hant
克罗地亚语 hr
捷克语 cs
丹麦语 da
荷兰语 nl
English en
世界语(新) eo
爱沙尼亚语 et
菲律宾语 fil
芬兰语 fi
法语 fr
加利西亚语 gl
格鲁吉亚语 ka
德语 de
希腊语 el
古吉拉特语 gu
豪萨语(新) ha
希伯来语 he
印地语 hi
匈牙利语 hu
印度尼西亚语 id
爱尔兰语 ga
意大利语 it
日语 ja
爪哇语(新) jv
卡纳达语 kn
哈萨克语 kk
高棉语 km
韩语 ko
库尔德语(Kurmanji) ku
柯尔克孜语 ky
老挝语 lo
拉丁语(新) la
拉脱维亚语 lv
立陶宛语 lt
马其顿语 mk
马达加斯加语 mg
马来语 ms
马拉雅拉姆语 ml
马拉地语 mr
蒙古语 mn
尼泊尔语 ne
挪威语 no
奥里亚语 or
奥罗莫语(新) om
普什图语 ps
波斯语 fa
波兰语 pl
葡萄牙语(葡萄牙) pt-PT pt 也接受
葡萄牙语(巴西) pt-BR
旁遮普语 pa
罗马尼亚语 ro
俄语 ru
梵文(新) sa
苏格兰盖尔语(新) gd
塞尔维亚语 sr
信德语(新) sd
僧伽罗语(新) si
斯洛伐克语 sk
斯洛文尼亚语 sl
索马里语 so
西班牙语 es
巽他语(新) su
斯瓦希里语 sw
瑞典语 sv
泰米尔语 ta
泰卢固语 te
泰语 th
土耳其语 tr
乌克兰语 uk
乌尔都语 ur
维吾尔语 ug
乌兹别克语 uz
越南语 vi
威尔士语 cy
西弗里西亚语(新) fy
科萨语(新) xh
意第绪语(新) yi

观点挖掘的语言支持

支持的语言代码总数:94

语言 语言代码 说明
南非荷兰语(新) af
阿尔巴尼亚语(新) sq
阿姆哈拉语(新) am
阿拉伯语 ar
亚美尼亚语(新) hy
阿萨姆语(新) as
阿塞拜疆语(新) az
巴斯克语(新) eu
白俄罗斯语(新) be
孟加拉语 bn
波斯尼亚语(新) bs
布列塔尼语(新) br
保加利亚语(新) bg
缅甸语(新) my
加泰罗尼亚语(新) ca
中文(简体) zh-hans zh 也接受
繁体中文(新) zh-hant
克罗地亚语(新) hr
捷克语(新) cs
丹麦语 da
荷兰语 nl
English en
世界语(新) eo
爱沙尼亚语(新) et
菲律宾语(新) fil
芬兰语 fi
法语 fr
加利西亚语(新) gl
格鲁吉亚语(新) ka
德语 de
希腊 el
古吉拉特语(新) gu
豪萨语(新) ha
希伯来语(新) he
Hindi hi
匈牙利语 hu
印度尼西亚语 id
爱尔兰(新) ga
意大利语 it
日语 ja
爪哇语(新) jv
卡纳达语(新) kn
哈萨克语(新) kk
高棉语(新) km
韩语 ko
库尔德语(Kurmanji) ku
吉尔吉斯语(新) ky
老挝语(新) lo
拉丁语(新) la
拉脱维亚语(新) lv
立陶宛语(新) lt
马其顿语(新) mk
马达加斯加语(新) mg
马来语(新) ms
马拉雅拉姆语(新) ml
马拉地语 mr
蒙古语(新) mn
尼泊尔语(新) ne
挪威语 no
奥里亚语(新) or
奥罗莫语(新) om
普什图语(新) ps
波斯语(新) fa
波兰语 pl
葡萄牙语(葡萄牙) pt-PT pt 也接受
葡萄牙语(巴西) pt-BR
旁遮普语(新) pa
罗马尼亚语(新) ro
俄语 ru
梵文(新) sa
苏格兰盖尔语(新) gd
塞尔维亚语(新) sr
信德语(新) sd
僧伽罗语(新) si
斯洛伐克语(新) sk
斯洛文尼亚语(新) sl
索马里语(新) so
西班牙语 es
巽他语(新) su
斯瓦希里语(新) sw
瑞典语 sv
泰米尔语 ta
泰卢固语 te
泰语(新) th
土耳其语 tr
乌克兰语(新) uk
乌尔都语(新) ur
维吾尔语(新) ug
乌兹别克语(新) uz
越南语(新) vi
威尔士语(新) cy
西弗里西亚语(新) fy
科萨语(新) xh
意第绪语(新) yi

多语言选项(自定义情绪分析仅)

通过自定义情绪分析,你可以使用一种语言训练模型,并使用另一种语言对文档进行分类。 此功能非常有用,因为它可以帮助你节省时间和精力。 你可以在一个项目中处理多语言数据集,而不是为每种语言构建单独的项目。 数据集不必完全使用相同的语言,但你应在创建时或稍后在项目设置中为项目启用多语言选项。 如果在评估过程中发现模型在某些语言中表现不佳,请考虑将更多这些语言的数据添加到训练集中。

你可以完全使用英语文档训练项目,并使用法语、德语、普通话、日语、韩语等语言进行查询。 通过使用多语言技术训练模型,自定义情绪分析使你可以轻松地将项目扩展为多种语言。

每当发现特定语言的表现不如其他语言时,就可以在项目中为该语言添加更多文档。

不需要为每种语言添加相同数量的文档。 应该用一种语言生成大部分项目,并且只添加你观察到表现不佳的语言的一些文档。 如果创建一个以英语为主要语言的项目,并开始使用法语、德语和西班牙语进行测试,你可能会发现德语的表现不如另外两种语言。 在这种情况下,请考虑使用德语添加 5% 的原始英语文档,训练新模型,然后再次使用德语进行测试。 对于德语查询,应会看到更好的结果。 添加的已标记文档越多,结果可能越好。

以另一种语言添加数据时,不应期望数据对其他语言产生负面影响。

后续步骤