Obsługa języka dla usługi Azure AI Vision
Niektóre możliwości usługi Azure AI Vision obsługują wiele języków; wszystkie możliwości, o których nie wspomniano tutaj, obsługują tylko język angielski.
Optyczne rozpoznawanie znaków (OCR)
Interfejs API odczytu usługi Azure AI Vision obsługuje wiele języków. Interfejs Read
API może wyodrębnić tekst z obrazów i dokumentów z językami mieszanymi, w tym z tego samego wiersza tekstu, bez konieczności używania parametru języka. Zobacz How to specify the model to use the Read
new languages (Jak określić model do używania nowych języków).
Uwaga
Kod języka opcjonalny
Read
Oparte na uczeniu głębokim modele uniwersalne wyodrębniają cały tekst wielojęzyczny w dokumentach, w tym wiersze tekstu z językami mieszanymi i nie wymagają określenia kodu językowego. Nie należy podawać kodu języka jako parametru, chyba że masz pewność co do języka i chcesz wymusić zastosowanie tylko odpowiedniego modelu. W przeciwnym razie usługa może zwrócić niekompletny i niepoprawny tekst.
Tekst odręczny
W poniższej tabeli wymieniono języki obsługiwane przez funkcję OCR dla tekstu odręcznego według najnowszego Read
modelu ogólnie dostępnego.
Język | Kod języka (opcjonalnie) | Język | Kod języka (opcjonalnie) |
---|---|---|---|
Angielski | en |
Japoński | ja |
Chiński uproszczony | zh-Hans |
Koreański | ko |
Francuski | fr |
Portugalski | pt |
Niemiecki | de |
Hiszpański | es |
Włoski | it |
Drukuj tekst
W poniższej tabeli wymieniono języki obsługiwane przez funkcję OCR do drukowania tekstu według najnowszego Read
modelu ogólnie dostępnego.
Język | Kod (opcjonalnie) | Język | Kod (opcjonalnie) |
---|---|---|---|
Afrikaans | af |
Khasi | kha |
Albański | sq |
K'iche' | quc |
Angika (Devanagiri) | anp |
Koreański | ko |
Arabski | ar |
Korku | kfq |
Asturyjski | ast |
Koryak | kpy |
Awadhi-Hindi (Devanagiri) | awa |
Kosraean | kos |
Azerbejdżan (łaciński) | az |
Kumyk (Cyrylica) | kum |
Bagheli | bfy |
Kurdyjski (arabski) | ku-arab |
Baskijski | eu |
Kurdyjski (łaciński) | ku-latn |
Białorusin (cyrylica) | be , be-cyrl |
Kurukh (Devanagiri) | kru |
Białorusi (łaciński) | be , be-latn |
Kyrgyz (Cyrylica) | ky |
Bhojpuri-Hindi (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Łacina | la |
Bodo (Devanagiri) | brx |
Litewski | lt |
Bośniacki (łaciński) | bs |
Dolnołużycki | dsb |
Brajbha | bra |
Lule Sami | smj |
Bretoński | br |
Luksemburski | lb |
Bułgarski | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Malajski (łaciński) | ms |
Buryat (Cyrylica) | bua |
Maltański | mt |
Kataloński | ca |
Malto (Devanagiri) | kmj |
Cebuano | ceb |
Manx | gv |
Chamling | rab |
Maoryski | mi |
Chamorro | ch |
Marathi | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongolski (cyrylica) | mn |
Chiński uproszczony | zh-Hans |
Czarnogóra (cyrylica) | cnr-cyrl |
Chiński tradycyjny | zh-Hant |
Czarnogóra (łacińska) | cnr-latn |
Kornwalijski | kw |
Neapolitański | nap |
Korsykański | co |
Nepalski | ne |
Tatar krymski (łaciński) | crh |
Niuean | niu |
Chorwacki | hr |
Nogay | nog |
Czeski | cs |
Północny Sami (łaciński) | sme |
Duński | da |
Norweski | no |
Dari | prs |
Occitan | oc |
Dhimal (Devanagiri) | dhi |
Ossetic | os |
Dogri (Devanagiri) | doi |
Paszto | ps |
Niderlandzki | nl |
Perski | fa |
angielski | en |
Polski | pl |
Erzya (cyrylica) | myv |
Portugalski | pt |
Estoński | et |
Punjabi (arabski) | pa |
Farerski | fo |
Ripuarian | ksh |
Fidżijski | fj |
Rumuński | ro |
Filipino | fil |
Retoromański | rm |
Fiński | fi |
Rosyjski | ru |
Francuski | fr |
Sadri (Devanagiri) | sck |
Friulian | fur |
Samoan (łaciński) | sm |
Gagauz (łaciński) | gag |
Sanskrit (Devanagari) | sa |
Galicyjski | gl |
Santali (Devanagiri) | sat |
Niemiecki | de |
Szkoci | sco |
Gilbertese | gil |
Język szkocki gaelicki | gd |
Gondi (Devanagiri) | gon |
Serbski (łaciński) | sr , sr-latn |
Grenlandzki | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Kreolski haitański | ht |
Skolt Sami | sms |
Halbi (Devanagiri) | hlb |
Słowacki | sk |
Hani | hni |
Słoweński | sl |
Haryanvi | bgc |
Somalia (arabski) | so |
Hawajski | haw |
Południowy Sami | sma |
Hindi | hi |
Hiszpański | es |
Hmong Daw (łaciński) | mww |
Swahili (łaciński) | sw |
Ho(Devanagiri) | hoc |
Szwedzki | sv |
Węgierski | hu |
Tadżyk (cyrylica) | tg |
Islandzki | is |
Tatar (łaciński) | tt |
Inari Sami | smn |
Tetum | tet |
Indonezyjski | id |
Thangmi | thf |
Interlingua | ia |
Tonga | to |
Inuktitut (łaciński) | iu |
Turecki | tr |
Irlandzki | ga |
Turkmen (łaciński) | tk |
Włoski | it |
Tuvan | tyv |
japoński | ja |
Górnołużycki | hsb |
Jaunsari (Devanagiri) | Jns |
Urdu | ur |
Jawajski | jv |
Uygur (arabski) | ug |
Kabuverdianu | kea |
Uzbek (arabski) | uz-arab |
Kachin (łaciński) | kac |
Uzbecki (Cyrylica) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Uzbek (łaciński) | uz |
Karachay-Balkar | krc |
Volapük | vo |
Kara-Kalpak (cyrylica) | kaa-cyrl |
Walser | wae |
Kara-Kalpak (łaciński) | kaa |
Walijski | cy |
Kaszubski | csb |
Zachodni Fryzyjscy | fy |
Kazachski (cyrylica) | kk-cyrl |
Maya | yua |
Kazachski (łaciński) | kk-latn |
Zhen | za |
Khaling | klr |
Zulu | zu |
Analiza obrazu
Niektóre funkcje interfejsu API analizowania — obraz może zwracać wyniki w innych językach określonych za pomocą parametru language
zapytania. Inne funkcje zwracają wyniki w języku angielskim niezależnie od tego, jaki język jest określony, a inne zgłaszają wyjątek dla nieobsługiwanych języków. Funkcje są określane przy użyciu visualFeatures
parametrów zapytania i details
. Zobacz Omówienie listy wszystkich akcji, które można wykonać za pomocą interfejsu API Analizowanie — obraz , lub postępuj zgodnie z przewodnikiem Instrukcje, aby je wypróbować.
Język | Kod języka | Kategorie | Tagi | opis | Dorosły, Marki, Kolor, Twarze, ImageType, Obiekty | Gwiazdy, punkty orientacyjne | Podpisy, gęste napisy |
---|---|---|---|---|---|---|---|
Arabski | ar |
✅ | |||||
Azerbejdżański | az |
✅ | |||||
Bułgarski | bg |
✅ | |||||
Bośniacki łaciński | bs |
✅ | |||||
Kataloński | ca |
✅ | |||||
Czeski | cs |
✅ | |||||
Walijski | cy |
✅ | |||||
Duński | da |
✅ | |||||
Niemiecki | de |
✅ | |||||
Grecki | el |
✅ | |||||
angielski | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Hiszpański | es |
✅ | ✅ | ✅ | ✅ | ||
Estoński | et |
✅ | |||||
Baskijski | eu |
✅ | |||||
Fiński | fi |
✅ | |||||
Francuski | fr |
✅ | |||||
Irlandzki | ga |
✅ | |||||
Galicyjski | gl |
✅ | |||||
Hebrajski | he |
✅ | |||||
Hindi | hi |
✅ | |||||
Chorwacki | hr |
✅ | |||||
Węgierski | hu |
✅ | |||||
Indonezyjski | id |
✅ | |||||
Włoski | it |
✅ | |||||
japoński | ja |
✅ | ✅ | ✅ | ✅ | ||
Kazachski | kk |
✅ | |||||
Koreański | ko |
✅ | |||||
Litewski | lt |
✅ | |||||
Łotewski | lv |
✅ | |||||
Macedoński | mk |
✅ | |||||
Malajska Malezja | ms |
✅ | |||||
Norweski (Bokmal) | nb |
✅ | |||||
Niderlandzki | nl |
✅ | |||||
Polski | pl |
✅ | |||||
Dari | prs |
✅ | |||||
Portugalski — Brazylia | pt-BR |
✅ | |||||
Portugalski — Portugalia | pt |
✅ | ✅ | ✅ | ✅ | ||
Portugalski — Portugalia | pt-PT |
✅ | |||||
Rumuński | ro |
✅ | |||||
Rosyjski | ru |
✅ | |||||
Słowacki | sk |
✅ | |||||
Słoweński | sl |
✅ | |||||
Serbski — cyrylica RS | sr-Cryl |
✅ | |||||
Serbski — łaciński RS | sr-Latn |
✅ | |||||
Szwedzki | sv |
✅ | |||||
Tajlandzki | th |
✅ | |||||
Turecki | tr |
✅ | |||||
ukraiński | uk |
✅ | |||||
wietnamski | vi |
✅ | |||||
Chiński uproszczony | zh |
✅ | ✅ | ✅ | ✅ | ||
Chiński uproszczony | zh-Hans |
✅ | |||||
Chiński tradycyjny | zh-Hant |
✅ |
Osadzanie wielomodalne
Najnowszy model osadzania wielomodalnego obsługuje wyszukiwanie wektorów w wielu językach. Oryginalny model obsługuje tylko angielski. Obrazy wektoryzowane w modelu tylko w języku angielskim nie są zgodne z wyszukiwaniem tekstu w modelu wielojęzycznym.
Język | Kod języka | 2023-04-15 model |
2022-04-11 model |
---|---|---|---|
Akrikaans | af |
✅ | |
Amharski | am |
✅ | |
Arabski | ar |
✅ | |
Ormiański | hy |
✅ | |
Asamski | as |
✅ | |
Asturyjski | ast |
✅ | |
Azerbejdżański | az |
✅ | |
Białoruski | be |
✅ | |
Bengalski | bn |
✅ | |
Bośniacki | bs |
✅ | |
Bułgarski | bg |
✅ | |
Birmański | my |
✅ | |
Kataloński | ca |
✅ | |
Cebuano | ceb |
✅ | |
Chińskiimpl | zho |
✅ | |
Chiński trad | zho |
✅ | |
Chorwacki | hr |
✅ | |
Czeski | cs |
✅ | |
Duński | da |
✅ | |
niderlandzki | nl |
✅ | |
angielski | en |
✅ | ✅ |
estoński | et |
✅ | |
Filipino (Tagalog) | tl |
✅ | |
Fiński | fi |
✅ | |
Francuski | fr |
✅ | |
Fulah | ff |
✅ | |
Galicyjski | gl |
✅ | |
Ganda | lg |
✅ | |
Gruziński | ka |
✅ | |
Niemiecki | de |
✅ | |
Grecki | el |
✅ | |
Gudżarati | gu |
✅ | |
Hausa | ha |
✅ | |
Hebrajski | he |
✅ | |
Hindi | hi |
✅ | |
węgierski, | hu |
✅ | |
Islandzki | is |
✅ | |
Igbo | ig |
✅ | |
Indonezyjski | id |
✅ | |
Irlandzki | ga |
✅ | |
Włoski | it |
✅ | |
japoński | ja |
✅ | |
Jawajski | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
Kannada | kn |
✅ | |
Kazachski | kk |
✅ | |
Khmerski | km |
✅ | |
Koreański | ko |
✅ | |
Kirgiski | ky |
✅ | |
Laotański | lo |
✅ | |
Łotewski | lv |
✅ | |
Lingala | ln |
✅ | |
Litewski | lt |
✅ | |
Luo | luo |
✅ | |
Luksemburski | lb |
✅ | |
Macedoński | mk |
✅ | |
Malajski | ms |
✅ | |
Malayalam | ml |
✅ | |
Maltański | mt |
✅ | |
Maoryski | mi |
✅ | |
Marathi | mr |
✅ | |
Mongolski | mn |
✅ | |
Nepalski | ne |
✅ | |
Soto Północne | ns |
✅ | |
Norweski | no |
✅ | |
Nyanja | ny |
✅ | |
Occitan | oc |
✅ | |
Orija | or |
✅ | |
Oromo | om |
✅ | |
Paszto | ps |
✅ | |
Perski | fa |
✅ | |
polski | pl |
✅ | |
portugalski (Brazylia) | pt |
✅ | |
Pendżabski | pa |
✅ | |
Rumuński | ro |
✅ | |
Rosyjski | ru |
✅ | |
Serbski | sr |
✅ | |
Shona | sn |
✅ | |
Sindhi | sd |
✅ | |
Słowacki | sk |
✅ | |
Słoweński | sl |
✅ | |
Somalijski | so |
✅ | |
Sorani Kurdyjski | ku |
✅ | |
Hiszpański (Ameryka Łacińska) | es |
✅ | |
Suahili | sw |
✅ | |
Szwedzki | sv |
✅ | |
Tadżycki | tg |
✅ | |
Tamilski | ta |
✅ | |
Telugu | te |
✅ | |
Tajlandzki | th |
✅ | |
Turecki | tr |
✅ | |
ukraiński | uk |
✅ | |
Umbundu | umb |
✅ | |
Urdu | ur |
✅ | |
Uzbecki | uz |
✅ | |
Wietnamski | vi |
✅ | |
Walijski | cy |
✅ | |
Wolof | wo |
✅ | |
Xhosa | xh |
✅ | |
Joruba | yo |
✅ | |
Zulu | zu |
✅ |