Podpora jazyků pro Azure AI Vision
Některé funkce služby Azure AI Vision podporují více jazyků; všechny možnosti, které zde nejsou zmíněny, podporují pouze angličtinu.
optické rozpoznávání znaků (OCR),
Rozhraní AZURE AI Vision Read API podporuje mnoho jazyků. Rozhraní Read
API může extrahovat text z obrázků a dokumentů se smíšenými jazyky, včetně stejného řádku textu, aniž by vyžadovalo parametr jazyka. Viz Postup určení Read
modelu pro použití nových jazyků.
Poznámka:
Volitelný kód jazyka
Read
Univerzální modely založené na hlubokém učení OCR extrahují veškerý vícejazyčný text v dokumentech, včetně textových řádků se smíšenými jazyky, a nevyžadují zadání kódu jazyka. Nezadádejte kód jazyka jako parametr, pokud si nejste jisti jazykem a chcete vynutit, aby služba použila pouze příslušný model. V opačném případě může služba vrátit neúplný a nesprávný text.
Rukou psaný text
Následující tabulka uvádí podporované jazyky OCR pro ručně psaný text podle nejnovějšího Read
modelu GA.
Jazyk | Kód jazyka (volitelné) | Jazyk | Kód jazyka (volitelné) |
---|---|---|---|
Angličtina | en |
Japonština | ja |
Čínština (zjednodušená) | zh-Hans |
Korejština | ko |
Francouzština | fr |
Portugalština | pt |
Němčina | de |
Španělština | es |
Italština | it |
Tisk textu
Následující tabulka uvádí podporované jazyky OCR pro tisk textu podle nejnovějšího Read
modelu GA.
Jazyk | Kód (volitelné) | Jazyk | Kód (volitelné) |
---|---|---|---|
Afrikánština | af |
Khasi | kha |
Albánština | sq |
K'iche' | quc |
Angika (Devanagiri) | anp |
Korejština | ko |
Arabština | ar |
Korku | kfq |
Asturština | ast |
Koryak | kpy |
Awadhi-Hindština (Devanagiri) | awa |
Kosraean | kos |
Ázerbájdžánština (latinka) | az |
Kumyk (cyrilice) | kum |
Bagheli | bfy |
Arabština (arabština) | ku-arab |
Baskičtina | eu |
Amerika (latinka) | ku-latn |
Běloruský (cyrilice) | be , be-cyrl |
Kurukh (Devanagiri) | kru |
Běloruský (latinka) | be , be-latn |
Kyrgyz (cyrilice) | ky |
Bhojpuri-Hindština (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Latina | la |
Bodo (Devanagiri) | brx |
Litevština | lt |
Bosenština (latinka) | bs |
Dolnolužičtina | dsb |
Brajbha | bra |
Lule Sami | smj |
Bretonština | br |
Lucemburština | lb |
Bulharština | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Malajá (latinka) | ms |
Buryat (cyrilice) | bua |
Maltština | mt |
Katalánština | ca |
Malto (Devanagiri) | kmj |
Cebuano | ceb |
Manština | gv |
Zkosení | rab |
Maorština | mi |
Chamorro | ch |
Maráthština | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongolština (cyrilice) | mn |
Čínština (zjednodušená) | zh-Hans |
Montenegrin (cyrilice) | cnr-cyrl |
Čínština (tradiční) | zh-Hant |
Montenegrin (latinka) | cnr-latn |
Cornwallština | kw |
Neapolské | nap |
Korsičtina | co |
Nepálština | ne |
Krymský Tatar (latinka) | crh |
Niuean | niu |
Chorvatština | hr |
Nogay | nog |
Čeština | cs |
Severní Sami (latinka) | sme |
Dánština | da |
Norština | no |
Dari | prs |
Okcitánština | oc |
Dhimal (Devanagiri) | dhi |
Ossetic | os |
Dogri (Devanagiri) | doi |
Pashto | ps |
Nizozemština | nl |
Perština | fa |
Angličtina | en |
Polština | pl |
Erzya (cyrilice) | myv |
Portugalština | pt |
Estonština | et |
Pašábština (arabština) | pa |
Faerština | fo |
Ripuarian | ksh |
Fidžijština | fj |
Rumunština | ro |
Filipino | fil |
Románština | rm |
Finština | fi |
Ruština | ru |
Francouzština | fr |
Sadri (Devanagiri) | sck |
Friulian | fur |
Samoan (latinka) | sm |
Gagauz (latinka) | gag |
Sanskrit (Devanagari) | sa |
Galicijština | gl |
Santali(Devanagiri) | sat |
Němčina | de |
Skotové | sco |
Gilbertese | gil |
Skotská gaelština | gd |
Gondi (Devanagiri) | gon |
Srbština (latinka) | sr , sr-latn |
Grónština | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Haitská kreolština | ht |
Skolt Sami | sms |
Halbi (Devanagiri) | hlb |
Slovenština | sk |
Hani | hni |
Slovinština | sl |
Haryanvi | bgc |
Somali (arabština) | so |
Havajský | haw |
Jižní Sami | sma |
Hindština | hi |
Španělština | es |
Hmong Daw (latinka) | mww |
Swahili (latinka) | sw |
Ho(Devanagiri) | hoc |
Švédština | sv |
Maďarština | hu |
Tádžik (cyrilice) | tg |
Islandština | is |
Tatar (latinka) | tt |
Inari Sami | smn |
Tetum | tet |
Indonéština | id |
Thangmi | thf |
Interlingua | ia |
Tongánština | to |
Inuktitut (latinka) | iu |
Turečtina | tr |
Irština | ga |
Turkmen (latinka) | tk |
Italština | it |
Tuvan | tyv |
Japonština | ja |
Hornolužická srbština | hsb |
Jaunsari (Devanagiri) | Jns |
Urdština | ur |
Jávský | jv |
Yghur (arabština) | ug |
Kabuverdianu | kea |
Uzbečtina (arabština) | uz-arab |
Kachin (latinka) | kac |
Uzbečtina (cyrilice) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Uzbečtina (latinka) | uz |
Karachay-Balkar | krc |
Volapük | vo |
Kara-Kalpak (cyrilice) | kaa-cyrl |
Walser | wae |
Kara-Kalpak (latinka) | kaa |
Velština | cy |
Kašubština | csb |
Západní Frisian | fy |
Kazaština (cyrilice) | kk-cyrl |
Yucatécká mayština | yua |
Kazaština (latinka) | kk-latn |
Zhuang | za |
Khaling | klr |
Zulština | zu |
Analýza obrázků
Některé funkce rozhraní API pro analýzu obrázků můžou vracet výsledky v jiných jazycích zadaných pomocí parametru language
dotazu. Jiné funkce vrací výsledky v angličtině bez ohledu na to, jaký jazyk je zadaný, a ostatní volají výjimku pro nepodporované jazyky. Funkce se zadají s visualFeatures
parametry dotazu a details
parametry dotazu. V přehledu najdete seznam všech akcí, které můžete dělat s rozhraním API analyzovat – obrázek, nebo si je můžete vyzkoušet podle pokynů.
Jazyk | Kód jazyka | Kategorie | Značky | Popis | Adult, Brands, Color, Faces, ImageType, Objects | Celebrity, Památky | Titulky, zhuštěné titulky |
---|---|---|---|---|---|---|---|
Arabština | ar |
✅ | |||||
Ázerbájdžánština | az |
✅ | |||||
Bulharština | bg |
✅ | |||||
Bosenština – latinka | bs |
✅ | |||||
Katalánština | ca |
✅ | |||||
Čeština | cs |
✅ | |||||
Velština | cy |
✅ | |||||
Dánština | da |
✅ | |||||
Němčina | de |
✅ | |||||
Řečtina | el |
✅ | |||||
Angličtina | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Španělština | es |
✅ | ✅ | ✅ | ✅ | ||
Estonština | et |
✅ | |||||
Baskičtina | eu |
✅ | |||||
Finština | fi |
✅ | |||||
Francouzština | fr |
✅ | |||||
Irština | ga |
✅ | |||||
Galicijština | gl |
✅ | |||||
Hebrejština | he |
✅ | |||||
Hindština | hi |
✅ | |||||
Chorvatština | hr |
✅ | |||||
Maďarština | hu |
✅ | |||||
Indonéština | id |
✅ | |||||
Italština | it |
✅ | |||||
Japonština | ja |
✅ | ✅ | ✅ | ✅ | ||
Kazaština | kk |
✅ | |||||
Korejština | ko |
✅ | |||||
Litevština | lt |
✅ | |||||
Lotyština | lv |
✅ | |||||
Makedonština | mk |
✅ | |||||
Malajská Malajsie | ms |
✅ | |||||
Norština (Bokmal) | nb |
✅ | |||||
Nizozemština | nl |
✅ | |||||
Polština | pl |
✅ | |||||
Dari | prs |
✅ | |||||
portugalština (Brazílie) | pt-BR |
✅ | |||||
portugalština (Portugalsko) | pt |
✅ | ✅ | ✅ | ✅ | ||
portugalština (Portugalsko) | pt-PT |
✅ | |||||
Rumunština | ro |
✅ | |||||
Ruština | ru |
✅ | |||||
Slovenština | sk |
✅ | |||||
Slovinština | sl |
✅ | |||||
Srbština – cyrilice RS | sr-Cryl |
✅ | |||||
Srbština – latinka RS | sr-Latn |
✅ | |||||
Švédština | sv |
✅ | |||||
Thajština | th |
✅ | |||||
Turečtina | tr |
✅ | |||||
Ukrajinština | uk |
✅ | |||||
Vietnamština | vi |
✅ | |||||
Čínština (zjednodušená) | zh |
✅ | ✅ | ✅ | ✅ | ||
Čínština (zjednodušená) | zh-Hans |
✅ | |||||
Čínština (tradiční) | zh-Hant |
✅ |
Vícemodální vkládání
Nejnovější model multimodal embeddings podporuje vektorové vyhledávání v mnoha jazycích. Původní model podporuje pouze angličtinu. Obrázky, které jsou vektorizovány v anglickém modelu, nejsou kompatibilní s vyhledáváním textu v multi-jazykovém modelu.
Jazyk | Kód jazyka | 2023-04-15 model |
2022-04-11 model |
---|---|---|---|
Akrikaans | af |
✅ | |
Amharština | am |
✅ | |
Arabština | ar |
✅ | |
Arménština | hy |
✅ | |
Ásámština | as |
✅ | |
Asturština | ast |
✅ | |
Ázerbájdžánština | az |
✅ | |
Běloruština | be |
✅ | |
Bengálština | bn |
✅ | |
Bosenština | bs |
✅ | |
Bulharština | bg |
✅ | |
Barmština | my |
✅ | |
Katalánština | ca |
✅ | |
Cebuano | ceb |
✅ | |
Čínština Simpl | zho |
✅ | |
Čínský trad | zho |
✅ | |
Chorvatština | hr |
✅ | |
Čeština | cs |
✅ | |
Dánština | da |
✅ | |
Nizozemština | nl |
✅ | |
Angličtina | en |
✅ | ✅ |
Estonština | et |
✅ | |
Filipínština (Tagalog) | tl |
✅ | |
Finština | fi |
✅ | |
Francouzština | fr |
✅ | |
Fulah | ff |
✅ | |
Galicijština | gl |
✅ | |
Ganda | lg |
✅ | |
Gruzínština | ka |
✅ | |
Němčina | de |
✅ | |
Řečtina | el |
✅ | |
Gudžarátština | gu |
✅ | |
Hausa | ha |
✅ | |
Hebrejština | he |
✅ | |
Hindština | hi |
✅ | |
Maďarština | hu |
✅ | |
Islandština | is |
✅ | |
Igbo | ig |
✅ | |
Indonéština | id |
✅ | |
Irština | ga |
✅ | |
Italština | it |
✅ | |
Japonština | ja |
✅ | |
Jávský | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
Kannadština | kn |
✅ | |
Kazaština | kk |
✅ | |
Khmerština | km |
✅ | |
Korejština | ko |
✅ | |
Kyrgyzština | ky |
✅ | |
Laoština | lo |
✅ | |
Lotyština | lv |
✅ | |
Lingala | ln |
✅ | |
Litevština | lt |
✅ | |
Luo | luo |
✅ | |
Lucemburština | lb |
✅ | |
Makedonština | mk |
✅ | |
Malajština | ms |
✅ | |
Malajalámština | ml |
✅ | |
Maltština | mt |
✅ | |
Maorština | mi |
✅ | |
Maráthština | mr |
✅ | |
Mongolština | mn |
✅ | |
Nepálština | ne |
✅ | |
Severní Sotho | ns |
✅ | |
Norština | no |
✅ | |
Nyanja | ny |
✅ | |
Okcitánština | oc |
✅ | |
Udijština | or |
✅ | |
Oromo | om |
✅ | |
Pashto | ps |
✅ | |
Perština | fa |
✅ | |
Polština | pl |
✅ | |
Portugalština (Brazílie) | pt |
✅ | |
Paňdžábština | pa |
✅ | |
Rumunština | ro |
✅ | |
Ruština | ru |
✅ | |
Srbština | sr |
✅ | |
Shona | sn |
✅ | |
Sindhština | sd |
✅ | |
Slovenština | sk |
✅ | |
Slovinština | sl |
✅ | |
Somálijsko | so |
✅ | |
SoraniKurh | ku |
✅ | |
Španělština (latinka americká) | es |
✅ | |
Svahilština | sw |
✅ | |
Švédština | sv |
✅ | |
Tádžičtina | tg |
✅ | |
Tamilština | ta |
✅ | |
Telugština | te |
✅ | |
Thajština | th |
✅ | |
Turečtina | tr |
✅ | |
Ukrajinština | uk |
✅ | |
Umbundu | umb |
✅ | |
Urdština | ur |
✅ | |
Uzbečtina | uz |
✅ | |
Vietnamština | vi |
✅ | |
Velština | cy |
✅ | |
Wolof | wo |
✅ | |
Xhoština | xh |
✅ | |
Jorubsky | yo |
✅ | |
Zulština | zu |
✅ |