Suporte a idiomas da Visão de IA do Azure
Algumas funcionalidades da Visão de IA do Azure dão suporte a vários idiomas. Todas as funcionalidades não mencionadas aqui só dão suporte ao inglês.
OCR (reconhecimento óptico de caracteres)
A API de Leitura da Visão de IA do Azure dá suporte a muitos idiomas. A API Read
pode extrair texto de imagens e documentos com idiomas variados, incluindo da mesma linha de texto, sem exigir um parâmetro de idioma. Confira Como especificar o modelo Read
para usar os novos idiomas.
Observação
Código de idioma opcional
Os modelos universais baseados em aprendizado profundo de OCR Read
extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas variados, e não exigem a especificação de um código de idioma. Não forneça o código de idioma como o parâmetro, a menos que você tenha certeza sobre o idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço poderá retornar texto incompleto e incorreto.
Texto manuscrito
A tabela a seguir lista os idiomas de OCR de texto manuscrito compatíveis com o modelo Read
GA mais recente.
Idioma | Código de idioma (opcional) | Idioma | Código de idioma (opcional) |
---|---|---|---|
Inglês | en |
Japonês | ja |
Chinês simplificado | zh-Hans |
Coreano | ko |
Francês | fr |
Português | pt |
Alemão | de |
Espanhol | es |
Italiano | it |
Texto impresso
A tabela a seguir lista os idiomas de OCR de texto impresso compatíveis com o modelo Read
GA mais recente.
Idioma | Código (opcional) | Idioma | Código (opcional) |
---|---|---|---|
Africâner | af |
Khasi | kha |
Albanês | sq |
Quiché | quc |
Angika (Devanagiri) | anp |
Coreano | ko |
Árabe | ar |
Korku | kfq |
Asturiano | ast |
koryak | kpy |
Hindi Awadhi (Devanagiri) | awa |
kosraean | kos |
Azerbaidjano (Latino) | az |
kumyk (cirílico) | kum |
Bagheli | bfy |
Curdo (árabe) | ku-arab |
Basco | eu |
Curdo (latino) | ku-latn |
bielorrusso (cirílico) | be , be-cyrl |
Kurux (Devanagiri) | kru |
bielorrusso (latino) | be , be-latn |
quirguiz (cirílico) | ky |
Hindi Bhojpuri (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Latim | la |
Bodo (Devanagiri) | brx |
Lituano | lt |
Bósnio (latim) | bs |
baixo sorábio | dsb |
Brajbha | bra |
sami de Lule | smj |
Bretão | br |
Luxemburguês | lb |
Búlgaro | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Malaio (latino) | ms |
buryat (cirílico) | bua |
Maltês | mt |
Catalão | ca |
Malto (Devanagiri) | kmj |
Cebuano | ceb |
Manx | gv |
Chamling | rab |
Maori | mi |
Chamorro | ch |
Marati | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongol (Cirílico) | mn |
Chinês simplificado | zh-Hans |
montenegrino (cirílico) | cnr-cyrl |
Chinês (tradicional) | zh-Hant |
montenegrino (latino) | cnr-latn |
Córnico | kw |
Napolitano | nap |
Corso | co |
Nepali | ne |
Tártaro da Crimeia (latim) | crh |
niueano | niu |
Croata | hr |
nogay | nog |
Tcheco | cs |
sami setentrional (latino) | sme |
Dinamarquês | da |
Norueguês | no |
Dari | prs |
Occitânico | oc |
Dhimal (Devanagiri) | dhi |
osseto | os |
Dogri (Devanagiri) | doi |
Pashto | ps |
Holandês | nl |
Persa | fa |
Inglês | en |
Polonês | pl |
erzya (cirílico) | myv |
Português | pt |
Estoniano | et |
Punjabi (Árabe) | pa |
Faroês | fo |
ripuário | ksh |
Fijiano | fj |
Romeno | ro |
Filipino | fil |
Romanche | rm |
Finlandês | fi |
Russo | ru |
Francês | fr |
Sadri (Devanagiri) | sck |
Friuliano | fur |
samoano (latino) | sm |
gagauz (latino) | gag |
Sanskrit (Devanagari) | sa |
Galego | gl |
Santali(Devanagiri) | sat |
Alemão | de |
Escocês | sco |
Gilbertês | gil |
Gaélico escocês | gd |
Gondi (Devanagiri) | gon |
Sérvio (latino) | sr , sr-latn |
Groenlandês | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Crioulo haitiano | ht |
sami de Skolt | sms |
Halbi (Devanagiri) | hlb |
Eslovaco | sk |
Hani | hni |
Esloveno | sl |
Haryanvi | bgc |
Somali (árabe) | so |
havaiano | haw |
sami do sul | sma |
Híndi | hi |
Espanhol | es |
Hmong daw (latim) | mww |
Suaíli (latim) | sw |
Ho(Devanagiri) | hoc |
Sueco | sv |
Húngaro | hu |
Tadjique (Cirílico) | tg |
Islandês | is |
Tártaro (latim) | tt |
sami de Inari | smn |
Tetum | tet |
Indonésio | id |
Thani | thf |
Interlíngua | ia |
Tongan | to |
Inuktitut (Latino) | iu |
Turco | tr |
Irlandês | ga |
turcomeno (latino) | tk |
Italiano | it |
Tuva | tyv |
Japonês | ja |
Alto sorábio | hsb |
Jaunsari (Devanagiri) | Jns |
Urdu | ur |
Javanês | jv |
Uigur (árabe) | ug |
Kabuverdianu | kea |
Usbeque (árabe) | uz-arab |
Kachin (latim) | kac |
Uzbeque (cirílico) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Uzbeque (latino) | uz |
Karachay-Balkar | krc |
Volapuque | vo |
kara-kalpak (cirílico) | kaa-cyrl |
Walser | wae |
Caracalpaque (latino) | kaa |
Galês | cy |
Cashubiano | csb |
Frísio ocidental | fy |
cazaque (cirílico) | kk-cyrl |
Yucatec Maya | yua |
cazaque (latino) | kk-latn |
Zuangue | za |
Khaling | klr |
Zulu | zu |
Análise de Imagens
Algumas funcionalidades da API de Análise – Imagem podem retornar resultados em outros idiomas, especificados com o parâmetro de consulta language
. Outros recursos retornam resultados em inglês, independentemente do idioma especificado, e outras geram uma exceção para idiomas sem suporte. Os recursos são especificados com os parâmetros de consulta visualFeatures
e details
; consulte a Visão geral para obter uma lista de todas as ações que você pode realizar com a API Analisar – Imagem ou siga o guia Como fazer para experimentá-las.
Linguagem | Código de idioma | Categorias | Marcações | Descrição | Adulto, Marcas, Cor, Rostos, ImageType, Objetos | Celebridades, Marcos | Legendas/legendas densas |
---|---|---|---|---|---|---|---|
Árabe | ar |
✅ | |||||
Azerbaidjano | az |
✅ | |||||
Búlgaro | bg |
✅ | |||||
Bósnio Latim | bs |
✅ | |||||
Catalão | ca |
✅ | |||||
Tcheco | cs |
✅ | |||||
Galês | cy |
✅ | |||||
Dinamarquês | da |
✅ | |||||
Alemão | de |
✅ | |||||
Grego | el |
✅ | |||||
Inglês | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Espanhol | es |
✅ | ✅ | ✅ | ✅ | ||
Estoniano | et |
✅ | |||||
Basco | eu |
✅ | |||||
Finlandês | fi |
✅ | |||||
Francês | fr |
✅ | |||||
Irlandês | ga |
✅ | |||||
Galego | gl |
✅ | |||||
Hebraico | he |
✅ | |||||
Híndi | hi |
✅ | |||||
Croata | hr |
✅ | |||||
Húngaro | hu |
✅ | |||||
Indonésio | id |
✅ | |||||
Italiano | it |
✅ | |||||
Japonês | ja |
✅ | ✅ | ✅ | ✅ | ||
Cazaque | kk |
✅ | |||||
Coreano | ko |
✅ | |||||
Lituano | lt |
✅ | |||||
Letão | lv |
✅ | |||||
Macedônio | mk |
✅ | |||||
Malaio Malásia | ms |
✅ | |||||
Norueguês (Bokmal) | nb |
✅ | |||||
Holandês | nl |
✅ | |||||
Polonês | pl |
✅ | |||||
Dari | prs |
✅ | |||||
Português-Brasil | pt-BR |
✅ | |||||
Português-Portugal | pt |
✅ | ✅ | ✅ | ✅ | ||
Português-Portugal | pt-PT |
✅ | |||||
Romeno | ro |
✅ | |||||
Russo | ru |
✅ | |||||
Eslovaco | sk |
✅ | |||||
Esloveno | sl |
✅ | |||||
Sérvio - Cirílico RS | sr-Cryl |
✅ | |||||
Sérvio - Latim RS | sr-Latn |
✅ | |||||
Sueco | sv |
✅ | |||||
Tailandês | th |
✅ | |||||
Turco | tr |
✅ | |||||
Ucraniano | uk |
✅ | |||||
Vietnamita | vi |
✅ | |||||
Chinês simplificado | zh |
✅ | ✅ | ✅ | ✅ | ||
Chinês simplificado | zh-Hans |
✅ | |||||
Chinês tradicional | zh-Hant |
✅ |
Inserções multimodal
O modelo de inserções multimodal mais recente dá suporte à busca em vetores em muitos idiomas. O modelo original dá suporte apenas ao inglês. As imagens que são vetorizadas no modelo somente em inglês não são compatíveis com as pesquisas de texto no modelo multilíngue.
Linguagem | Código do idioma | 2023-04-15 model |
2022-04-11 model |
---|---|---|---|
Africâner | af |
✅ | |
Amárico | am |
✅ | |
Árabe | ar |
✅ | |
Armênia | hy |
✅ | |
Assamês | as |
✅ | |
Asturiano | ast |
✅ | |
Azerbaidjano | az |
✅ | |
Bielorrusso | be |
✅ | |
Bengali | bn |
✅ | |
Bósnio | bs |
✅ | |
Búlgaro | bg |
✅ | |
Birmanês | my |
✅ | |
Catalão | ca |
✅ | |
Cebuano | ceb |
✅ | |
Chinês simplificado | zho |
✅ | |
Chinês tradicional | zho |
✅ | |
Croata | hr |
✅ | |
Tcheco | cs |
✅ | |
Dinamarquês | da |
✅ | |
Holandês | nl |
✅ | |
Inglês | en |
✅ | ✅ |
Estoniano | et |
✅ | |
Filipino (Tagalog) | tl |
✅ | |
Finlandês | fi |
✅ | |
Francês | fr |
✅ | |
Fulah | ff |
✅ | |
Galego | gl |
✅ | |
Ganda | lg |
✅ | |
Georgiano | ka |
✅ | |
Alemão | de |
✅ | |
Grego | el |
✅ | |
Guzerate | gu |
✅ | |
Hausa | ha |
✅ | |
Hebraico | he |
✅ | |
Híndi | hi |
✅ | |
Húngaro | hu |
✅ | |
Islandês | is |
✅ | |
Igbo | ig |
✅ | |
Indonésio | id |
✅ | |
Irlandês | ga |
✅ | |
Italiano | it |
✅ | |
Japonês | ja |
✅ | |
Javanês | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
canarim | kn |
✅ | |
Cazaque | kk |
✅ | |
Khmer | km |
✅ | |
Coreano | ko |
✅ | |
Kyrgyz | ky |
✅ | |
Lao | lo |
✅ | |
Letão | lv |
✅ | |
Lingala | ln |
✅ | |
Lituano | lt |
✅ | |
Luo | luo |
✅ | |
Luxemburguês | lb |
✅ | |
Macedônio | mk |
✅ | |
Malaio | ms |
✅ | |
Malaiala | ml |
✅ | |
Maltês | mt |
✅ | |
Maori | mi |
✅ | |
Marati | mr |
✅ | |
Mongol | mn |
✅ | |
Nepali | ne |
✅ | |
Soto do Norte | ns |
✅ | |
Norueguês | no |
✅ | |
Nianja | ny |
✅ | |
Occitânico | oc |
✅ | |
Oriá | or |
✅ | |
Oromo | om |
✅ | |
Pashto | ps |
✅ | |
Persa | fa |
✅ | |
Polonês | pl |
✅ | |
Português (Brasil) | pt |
✅ | |
Panjabi | pa |
✅ | |
Romeno | ro |
✅ | |
Russo | ru |
✅ | |
Sérvio | sr |
✅ | |
Shona | sn |
✅ | |
Sindhi | sd |
✅ | |
Eslovaco | sk |
✅ | |
Esloveno | sl |
✅ | |
Somali | so |
✅ | |
Sorâni | ku |
✅ | |
Espanhol (América Latina) | es |
✅ | |
Swahili | sw |
✅ | |
Sueco | sv |
✅ | |
Tajik | tg |
✅ | |
Tâmil | ta |
✅ | |
Télugo | te |
✅ | |
Tailandês | th |
✅ | |
Turco | tr |
✅ | |
Ucraniano | uk |
✅ | |
Umbundu | umb |
✅ | |
Urdu | ur |
✅ | |
Uzbek | uz |
✅ | |
Vietnamita | vi |
✅ | |
Galês | cy |
✅ | |
Wolof | wo |
✅ | |
Xhosa | xh |
✅ | |
Ioruba | yo |
✅ | |
Zulu | zu |
✅ |