Compartilhar via


Suporte a idiomas da Visão de IA do Azure

Algumas funcionalidades da Visão de IA do Azure dão suporte a vários idiomas. Todas as funcionalidades não mencionadas aqui só dão suporte ao inglês.

OCR (reconhecimento óptico de caracteres)

A API de Leitura da Visão de IA do Azure dá suporte a muitos idiomas. A API Read pode extrair texto de imagens e documentos com idiomas variados, incluindo da mesma linha de texto, sem exigir um parâmetro de idioma. Confira Como especificar o modelo Read para usar os novos idiomas.

Observação

Código de idioma opcional

Os modelos universais baseados em aprendizado profundo de OCR Read extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas variados, e não exigem a especificação de um código de idioma. Não forneça o código de idioma como o parâmetro, a menos que você tenha certeza sobre o idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço poderá retornar texto incompleto e incorreto.

Texto manuscrito

A tabela a seguir lista os idiomas de OCR de texto manuscrito compatíveis com o modelo Read GA mais recente.

Idioma Código de idioma (opcional) Idioma Código de idioma (opcional)
Inglês en Japonês ja
Chinês simplificado zh-Hans Coreano ko
Francês fr Português pt
Alemão de Espanhol es
Italiano it

A tabela a seguir lista os idiomas de OCR de texto impresso compatíveis com o modelo Read GA mais recente.

Idioma Código (opcional) Idioma Código (opcional)
Africâner af Khasi kha
Albanês sq Quiché quc
Angika (Devanagiri) anp Coreano ko
Árabe ar Korku kfq
Asturiano ast koryak kpy
Hindi Awadhi (Devanagiri) awa kosraean kos
Azerbaidjano (Latino) az kumyk (cirílico) kum
Bagheli bfy Curdo (árabe) ku-arab
Basco eu Curdo (latino) ku-latn
bielorrusso (cirílico) be, be-cyrl Kurux (Devanagiri) kru
bielorrusso (latino) be, be-latn quirguiz (cirílico) ky
Hindi Bhojpuri (Devanagiri) bho Lakota lkt
Bislama bi Latim la
Bodo (Devanagiri) brx Lituano lt
Bósnio (latim) bs baixo sorábio dsb
Brajbha bra sami de Lule smj
Bretão br Luxemburguês lb
Búlgaro bg Mahasu Pahari (Devanagiri) bfz
Bundeli bns Malaio (latino) ms
buryat (cirílico) bua Maltês mt
Catalão ca Malto (Devanagiri) kmj
Cebuano ceb Manx gv
Chamling rab Maori mi
Chamorro ch Marati mr
Chhattisgarhi (Devanagiri) hne Mongol (Cirílico) mn
Chinês simplificado zh-Hans montenegrino (cirílico) cnr-cyrl
Chinês (tradicional) zh-Hant montenegrino (latino) cnr-latn
Córnico kw Napolitano nap
Corso co Nepali ne
Tártaro da Crimeia (latim) crh niueano niu
Croata hr nogay nog
Tcheco cs sami setentrional (latino) sme
Dinamarquês da Norueguês no
Dari prs Occitânico oc
Dhimal (Devanagiri) dhi osseto os
Dogri (Devanagiri) doi Pashto ps
Holandês nl Persa fa
Inglês en Polonês pl
erzya (cirílico) myv Português pt
Estoniano et Punjabi (Árabe) pa
Faroês fo ripuário ksh
Fijiano fj Romeno ro
Filipino fil Romanche rm
Finlandês fi Russo ru
Francês fr Sadri (Devanagiri) sck
Friuliano fur samoano (latino) sm
gagauz (latino) gag Sanskrit (Devanagari) sa
Galego gl Santali(Devanagiri) sat
Alemão de Escocês sco
Gilbertês gil Gaélico escocês gd
Gondi (Devanagiri) gon Sérvio (latino) sr, sr-latn
Groenlandês kl Sherpa (Devanagiri) xsr
Gurung (Devanagiri) gvr Sirmauri (Devanagiri) srx
Crioulo haitiano ht sami de Skolt sms
Halbi (Devanagiri) hlb Eslovaco sk
Hani hni Esloveno sl
Haryanvi bgc Somali (árabe) so
havaiano haw sami do sul sma
Híndi hi Espanhol es
Hmong daw (latim) mww Suaíli (latim) sw
Ho(Devanagiri) hoc Sueco sv
Húngaro hu Tadjique (Cirílico) tg
Islandês is Tártaro (latim) tt
sami de Inari smn Tetum tet
Indonésio id Thani thf
Interlíngua ia Tongan to
Inuktitut (Latino) iu Turco tr
Irlandês ga turcomeno (latino) tk
Italiano it Tuva tyv
Japonês ja Alto sorábio hsb
Jaunsari (Devanagiri) Jns Urdu ur
Javanês jv Uigur (árabe) ug
Kabuverdianu kea Usbeque (árabe) uz-arab
Kachin (latim) kac Uzbeque (cirílico) uz-cyrl
Kangri (Devanagiri) xnr Uzbeque (latino) uz
Karachay-Balkar krc Volapuque vo
kara-kalpak (cirílico) kaa-cyrl Walser wae
Caracalpaque (latino) kaa Galês cy
Cashubiano csb Frísio ocidental fy
cazaque (cirílico) kk-cyrl Yucatec Maya yua
cazaque (latino) kk-latn Zuangue za
Khaling klr Zulu zu

Análise de Imagens

Algumas funcionalidades da API de Análise – Imagem podem retornar resultados em outros idiomas, especificados com o parâmetro de consulta language. Outros recursos retornam resultados em inglês, independentemente do idioma especificado, e outras geram uma exceção para idiomas sem suporte. Os recursos são especificados com os parâmetros de consulta visualFeatures e details; consulte a Visão geral para obter uma lista de todas as ações que você pode realizar com a API Analisar – Imagem ou siga o guia Como fazer para experimentá-las.

Linguagem Código de idioma Categorias Marcações Descrição Adulto, Marcas, Cor, Rostos, ImageType, Objetos Celebridades, Marcos Legendas/legendas densas
Árabe ar
Azerbaidjano az
Búlgaro bg
Bósnio Latim bs
Catalão ca
Tcheco cs
Galês cy
Dinamarquês da
Alemão de
Grego el
Inglês en
Espanhol es
Estoniano et
Basco eu
Finlandês fi
Francês fr
Irlandês ga
Galego gl
Hebraico he
Híndi hi
Croata hr
Húngaro hu
Indonésio id
Italiano it
Japonês ja
Cazaque kk
Coreano ko
Lituano lt
Letão lv
Macedônio mk
Malaio Malásia ms
Norueguês (Bokmal) nb
Holandês nl
Polonês pl
Dari prs
Português-Brasil pt-BR
Português-Portugal pt
Português-Portugal pt-PT
Romeno ro
Russo ru
Eslovaco sk
Esloveno sl
Sérvio - Cirílico RS sr-Cryl
Sérvio - Latim RS sr-Latn
Sueco sv
Tailandês th
Turco tr
Ucraniano uk
Vietnamita vi
Chinês simplificado zh
Chinês simplificado zh-Hans
Chinês tradicional zh-Hant

Inserções multimodal

O modelo de inserções multimodal mais recente dá suporte à busca em vetores em muitos idiomas. O modelo original dá suporte apenas ao inglês. As imagens que são vetorizadas no modelo somente em inglês não são compatíveis com as pesquisas de texto no modelo multilíngue.

Linguagem Código do idioma 2023-04-15 model 2022-04-11 model
Africâner af
Amárico am
Árabe ar
Armênia hy
Assamês as
Asturiano ast
Azerbaidjano az
Bielorrusso be
Bengali bn
Bósnio bs
Búlgaro bg
Birmanês my
Catalão ca
Cebuano ceb
Chinês simplificado zho
Chinês tradicional zho
Croata hr
Tcheco cs
Dinamarquês da
Holandês nl
Inglês en
Estoniano et
Filipino (Tagalog) tl
Finlandês fi
Francês fr
Fulah ff
Galego gl
Ganda lg
Georgiano ka
Alemão de
Grego el
Guzerate gu
Hausa ha
Hebraico he
Híndi hi
Húngaro hu
Islandês is
Igbo ig
Indonésio id
Irlandês ga
Italiano it
Japonês ja
Javanês jv
Kabuverdianu kea
Kamba kam
canarim kn
Cazaque kk
Khmer km
Coreano ko
Kyrgyz ky
Lao lo
Letão lv
Lingala ln
Lituano lt
Luo luo
Luxemburguês lb
Macedônio mk
Malaio ms
Malaiala ml
Maltês mt
Maori mi
Marati mr
Mongol mn
Nepali ne
Soto do Norte ns
Norueguês no
Nianja ny
Occitânico oc
Oriá or
Oromo om
Pashto ps
Persa fa
Polonês pl
Português (Brasil) pt
Panjabi pa
Romeno ro
Russo ru
Sérvio sr
Shona sn
Sindhi sd
Eslovaco sk
Esloveno sl
Somali so
Sorâni ku
Espanhol (América Latina) es
Swahili sw
Sueco sv
Tajik tg
Tâmil ta
Télugo te
Tailandês th
Turco tr
Ucraniano uk
Umbundu umb
Urdu ur
Uzbek uz
Vietnamita vi
Galês cy
Wolof wo
Xhosa xh
Ioruba yo
Zulu zu