Språkstöd för Azure AI Vision
Vissa funktioner i Azure AI Vision stöder flera språk. alla funktioner som inte nämns här stöder endast engelska.
Optisk teckenläsning (OCR)
Läs-API:et för Azure AI Vision stöder många språk. API:et Read
kan extrahera text från bilder och dokument med blandade språk, inklusive från samma textrad, utan att det krävs någon språkparameter. Se Så här anger du vilken modell som Read
ska använda de nya språken.
Kommentar
Språkkod valfritt
Read
OCR:s djupinlärningsbaserade universella modeller extraherar all flerspråkig text i dina dokument, inklusive textrader med blandade språk, och kräver inte att du anger någon språkkod. Ange inte språkkoden som parameter om du inte är säker på språket och vill tvinga tjänsten att endast tillämpa den relevanta modellen. Annars kan tjänsten returnera ofullständig och felaktig text.
Handskriven text
I följande tabell visas de OCR-språk som stöds för handskriven text av den senaste Read
GA-modellen.
Språk | Språkkod (valfritt) | Språk | Språkkod (valfritt) |
---|---|---|---|
Engelska | en |
Japanska | ja |
Kinesiska (förenklad) | zh-Hans |
Koreanska | ko |
Franska | fr |
Portugisiska | pt |
Tyska | de |
Spanska | es |
Italienska | it |
Skriv ut text
I följande tabell visas de OCR-språk som stöds för utskrift av text enligt den senaste Read
GA-modellen.
Språk | Kod (valfritt) | Språk | Kod (valfritt) |
---|---|---|---|
Afrikaans | af |
Khasi | kha |
Albanska | sq |
K'iche' | quc |
Angika (Devanagiri) | anp |
Koreanska | ko |
Arabiska | ar |
Korku | kfq |
Asturiska | ast |
Koryak | kpy |
Awadhi-Hindi (Devanagiri) | awa |
Kosraean | kos |
Azerbajdzjanska (latinsk) | az |
Kumyk (kyrillisk) | kum |
Bagheli | bfy |
Kurdiska (arabiska) | ku-arab |
Baskiska | eu |
Kurdiska (latinsk) | ku-latn |
Vitryska (kyrillisk) | be , be-cyrl |
Kurukh (Devanagiri) | kru |
Vitryska (latinsk) | be , be-latn |
Kirgizistan (kyrillisk) | ky |
Bhojpuri-Hindi (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Latin | la |
Bodo (Devanagiri) | brx |
Litauiska | lt |
Bosniska (latinsk) | bs |
Lägre sorbian | dsb |
Brajbha | bra |
Lulesamiska | smj |
Bretonska | br |
Luxemburgiska | lb |
Bulgariska | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Malay (latinsk) | ms |
Buryat (kyrillisk) | bua |
Maltesiska | mt |
Katalanska | ca |
Malto (Devanagiri) | kmj |
Cebuano | ceb |
Manx | gv |
Chamling | rab |
Maori | mi |
Chamorro | ch |
Marathi | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongoliska (kyrillisk) | mn |
Kinesiska (förenklad) | zh-Hans |
Montenegrin (kyrillisk) | cnr-cyrl |
Kinesiska (traditionell) | zh-Hant |
Montenegrin (latinsk) | cnr-latn |
Korniska | kw |
Neapolitanska | nap |
Korsikanska | co |
Nepali | ne |
Krimtatar (latinsk) | crh |
Niuean | niu |
Kroatiska | hr |
Nogay | nog |
Tjeckiska | cs |
Nordsamiska (latinsk) | sme |
Danska | da |
Norska | no |
Dari | prs |
Occitanska | oc |
Dhimal (Devanagiri) | dhi |
Ossetic | os |
Dogri (Devanagiri) | doi |
Pashto | ps |
Nederländska | nl |
Persiska | fa |
Engelska | en |
Polska | pl |
Erzya (kyrillisk) | myv |
Portugisiska | pt |
Estniska | et |
Punjabi (arabiska) | pa |
Färöiska | fo |
Ripuarian | ksh |
Fijianska | fj |
Rumänska | ro |
Filipino | fil |
Rätoromanska | rm |
Finska | fi |
Ryska | ru |
Franska | fr |
Sadri (Devanagiri) | sck |
Friuliska | fur |
Samoanska (latinsk) | sm |
Gagauz (latinsk) | gag |
Sanskrit (Devanagari) | sa |
Galiciska | gl |
Santali(Devanagiri) | sat |
Tyska | de |
Skotsk | sco |
Gilbertese | gil |
Skotsk gäliska | gd |
Gondi (Devanagiri) | gon |
Serbiska (latinsk) (Serbien) | sr , sr-latn |
Grönländsk | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Haitisk kreol | ht |
Skoltsamiska | sms |
Halbi (Devanagiri) | hlb |
Slovakiska | sk |
Hani | hni |
Slovenska | sl |
Haryanvi | bgc |
Somaliska (arabiska) | so |
Hawaiiansk | haw |
Sydsamiska | sma |
Hindi | hi |
Spanska | es |
Hmong Daw (latinsk) | mww |
Swahili (latinsk) | sw |
Ho(Devanagiri) | hoc |
Svenska | sv |
Ungerska | hu |
Tadzjikiska (kyrillisk) | tg |
Isländska | is |
Tatar (latinsk) | tt |
Enaresamiska | smn |
Tetum | tet |
Indonesiska | id |
Thangmi | thf |
Interlingua | ia |
Tonga | to |
Inuktitut (latinsk) | iu |
Turkiska | tr |
Iriska | ga |
Turkmen (latinsk) | tk |
Italienska | it |
Tuvan | tyv |
Japanska | ja |
Högsorbiska | hsb |
Jaunsari (Devanagiri) | Jns |
Urdu | ur |
Javanesiska | jv |
Uiguriska (arabiska) | ug |
Kabuverdianu | kea |
Uzbekiska (arabiska) | uz-arab |
Kachin (latinsk) | kac |
Uzbekiska (kyrillisk) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Uzbekiska (latinsk) | uz |
Karachay-Balkar | krc |
Volapük | vo |
Kara-Kalpak (kyrillisk) | kaa-cyrl |
Walser | wae |
Kara-Kalpak (latinsk) | kaa |
Walesiska | cy |
Kasjubiska | csb |
Västra frisiska | fy |
Kazakiska (kyrilliska) | kk-cyrl |
Yukatekisk maya | yua |
Kazakiska (latinsk) | kk-latn |
Zhuang | za |
Khaling | klr |
Zulu | zu |
Bildanalys
Vissa funktioner i API:et Analysera – bild kan returnera resultat på andra språk, som anges med language
frågeparametern. Andra funktioner returnerar resultat på engelska oavsett vilket språk som anges, och andra genererar ett undantag för språk som inte stöds. Funktioner har angetts med visualFeatures
frågeparametrarna och details
finns i Översikt för en lista över alla åtgärder du kan göra med API:et Analysera – bild eller följ guiden Så här provar du dem.
Språk | Språkkod | Kategorier | Taggar | beskrivning | Vuxen, Varumärken, Färg, Ansikten, ImageType, Objekt | Kändisar, landmärken | Bildtexter, kompakta bildtexter |
---|---|---|---|---|---|---|---|
Arabiska | ar |
✅ | |||||
Azerbajdzjanska | az |
✅ | |||||
Bulgariska | bg |
✅ | |||||
Bosniska latinska | bs |
✅ | |||||
Katalanska | ca |
✅ | |||||
Tjeckiska | cs |
✅ | |||||
Walesiska | cy |
✅ | |||||
Danska | da |
✅ | |||||
Tyska | de |
✅ | |||||
Grekiska | el |
✅ | |||||
Engelska | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Spanska | es |
✅ | ✅ | ✅ | ✅ | ||
Estniska | et |
✅ | |||||
Baskiska | eu |
✅ | |||||
Finska | fi |
✅ | |||||
Franska | fr |
✅ | |||||
Iriska | ga |
✅ | |||||
Galiciska | gl |
✅ | |||||
Hebreiska | he |
✅ | |||||
Hindi | hi |
✅ | |||||
Kroatiska | hr |
✅ | |||||
Ungerska | hu |
✅ | |||||
Indonesiska | id |
✅ | |||||
Italienska | it |
✅ | |||||
Japanska | ja |
✅ | ✅ | ✅ | ✅ | ||
Kazakiska | kk |
✅ | |||||
Koreanska | ko |
✅ | |||||
Litauiska | lt |
✅ | |||||
Lettiska | lv |
✅ | |||||
Makedonska | mk |
✅ | |||||
Malay Malaysia | ms |
✅ | |||||
Norska (Bokmal) | nb |
✅ | |||||
Nederländska | nl |
✅ | |||||
Polska | pl |
✅ | |||||
Dari | prs |
✅ | |||||
Portugisiska (Brasilien) | pt-BR |
✅ | |||||
Portugisiska (Portugal) | pt |
✅ | ✅ | ✅ | ✅ | ||
Portugisiska (Portugal) | pt-PT |
✅ | |||||
Rumänska | ro |
✅ | |||||
Ryska | ru |
✅ | |||||
Slovakiska | sk |
✅ | |||||
Slovenska | sl |
✅ | |||||
Serbiska – kyrillisk RS | sr-Cryl |
✅ | |||||
Serbiska – latinsk RS | sr-Latn |
✅ | |||||
Svenska | sv |
✅ | |||||
Thailändska | th |
✅ | |||||
Turkiska | tr |
✅ | |||||
Ukrainska | uk |
✅ | |||||
Vietnamesiska | vi |
✅ | |||||
Kinesiska (förenklad) | zh |
✅ | ✅ | ✅ | ✅ | ||
Kinesiska (förenklad) | zh-Hans |
✅ | |||||
Kinesiska (traditionell) | zh-Hant |
✅ |
Multimodala inbäddningar
Den senaste multimodala inbäddningsmodellen stöder vektorsökning på många språk. Den ursprungliga modellen stöder endast engelska. Bilder som är vektoriserade i modellen endast på engelska är inte kompatibla med textsökningar i den flerspråkiga modellen.
Språk | Språkkod | 2023-04-15 modell |
2022-04-11 modell |
---|---|---|---|
Akrikaans | af |
✅ | |
Amhariska | am |
✅ | |
Arabiska | ar |
✅ | |
Armeniska | hy |
✅ | |
Assamesiska | as |
✅ | |
Asturiska | ast |
✅ | |
Azerbajdzjanska | az |
✅ | |
Vitryska | be |
✅ | |
Bengali | bn |
✅ | |
Bosnian | bs |
✅ | |
Bulgariska | bg |
✅ | |
Burmesiska | my |
✅ | |
Katalanska | ca |
✅ | |
Cebuano | ceb |
✅ | |
Kinesiska simpl | zho |
✅ | |
Kinesisk trad | zho |
✅ | |
Kroatiska | hr |
✅ | |
Tjeckiska | cs |
✅ | |
Danska | da |
✅ | |
Nederländska | nl |
✅ | |
Engelska | en |
✅ | ✅ |
Estniska | et |
✅ | |
Filippinska (Tagalog) | tl |
✅ | |
Finska | fi |
✅ | |
Franska | fr |
✅ | |
Fulah | ff |
✅ | |
Galiciska | gl |
✅ | |
Luganda | lg |
✅ | |
Georgiska | ka |
✅ | |
Tyska | de |
✅ | |
Grekiska | el |
✅ | |
Gujarati | gu |
✅ | |
Hausa | ha |
✅ | |
Hebreiska | he |
✅ | |
Hindi | hi |
✅ | |
Ungerska | hu |
✅ | |
Isländska | is |
✅ | |
Ibo | ig |
✅ | |
Indonesiska | id |
✅ | |
Iriska | ga |
✅ | |
Italienska | it |
✅ | |
Japanska | ja |
✅ | |
Javanesiska | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
Kannada | kn |
✅ | |
Kazakiska | kk |
✅ | |
Khmer | km |
✅ | |
Koreanska | ko |
✅ | |
Kirgisiska | ky |
✅ | |
Laotiska | lo |
✅ | |
Lettiska | lv |
✅ | |
Lingala | ln |
✅ | |
Litauiska | lt |
✅ | |
Luo | luo |
✅ | |
Luxemburgiska | lb |
✅ | |
Makedonska | mk |
✅ | |
Malajiska | ms |
✅ | |
Malayalam | ml |
✅ | |
Maltesiska | mt |
✅ | |
Maori | mi |
✅ | |
Marathi | mr |
✅ | |
Mongoliska | mn |
✅ | |
Nepali | ne |
✅ | |
Sepedi | ns |
✅ | |
Norska | no |
✅ | |
Nyanja | ny |
✅ | |
Occitanska | oc |
✅ | |
Odia | or |
✅ | |
Oromo | om |
✅ | |
Pashto | ps |
✅ | |
Persiska | fa |
✅ | |
Polska | pl |
✅ | |
Portugisiska (Brasilien) | pt |
✅ | |
Punjabi | pa |
✅ | |
Rumänska | ro |
✅ | |
Ryska | ru |
✅ | |
Serbiska | sr |
✅ | |
Shona | sn |
✅ | |
Sindhi | sd |
✅ | |
Slovakiska | sk |
✅ | |
Slovenska | sl |
✅ | |
Somali | so |
✅ | |
Sorani kurdiska | ku |
✅ | |
Spanska (latinamerikanska) | es |
✅ | |
Swahili | sw |
✅ | |
Svenska | sv |
✅ | |
Tadzjikiska | tg |
✅ | |
Tamilska | ta |
✅ | |
Telugu | te |
✅ | |
Thailändska | th |
✅ | |
Turkiska | tr |
✅ | |
Ukrainska | uk |
✅ | |
Umbundu | umb |
✅ | |
Urdu | ur |
✅ | |
Uzbekiska | uz |
✅ | |
Vietnamesiska | vi |
✅ | |
Walesiska | cy |
✅ | |
Wolof | wo |
✅ | |
Xhosa | xh |
✅ | |
Yoruba | yo |
✅ | |
Zulu | zu |
✅ |