Suporte de idioma para deteção de idioma
Use este artigo para saber quais linguagens naturais são suportadas pela deteção de idioma.
O recurso de deteção de idioma pode detetar uma ampla gama de idiomas, variantes, dialetos e alguns idiomas regionais/culturais e retornar idiomas detetados com seu nome e código. Os parâmetros do código de idioma retornado estão em conformidade com o padrão BCP-47 , com a maioria deles em conformidade com os identificadores ISO-639-1 .
Se você tiver conteúdo expresso em um idioma usado com menos frequência, tente a Deteção de Idioma para ver se ele retorna um código. A resposta para idiomas que não podem ser detetados é unknown
.
Idiomas suportados pela Deteção de Idiomas
Linguagem | Código do Idioma | Código de script suportado |
---|---|---|
Afrikaans | af |
Latn |
Albanês | sq |
Latn |
Amárico | am |
Ethi |
Árabe | ar |
Arab |
Arménio | hy |
Armn |
Assamês | as |
Beng , Latn |
Azerbaijanês | az |
Latn |
Basquir | ba |
Cyrl |
Basco | eu |
Latn |
Bielorrusso | be |
Cyrl |
Bengalês | bn |
Beng , Latn |
Bhojpuri | bho |
Deva |
Bodo | brx |
Deva |
Bósnio | bs |
Latn |
Búlgaro | bg |
Cyrl |
Birmanês | my |
Mymr |
Catalão | ca |
Latn |
Central Khmer | km |
Khmr |
Checheno | ce |
Cyrl |
Chhattisgarhi | hne |
Deva |
Chinês Literal | lzh |
Hani |
Chineses (Simplificado) | zh_chs |
Hans |
Chinês (Tradicional) | zh_cht |
Hant |
Chuvash | cv |
Cyrl |
Córsega | co |
Latn |
Croata | hr |
Latn |
Checo | cs |
Latn |
Dinamarquês | da |
Latn |
Dari | prs |
Arab |
Divehi | dv |
Thaa |
Dogri | dgo |
Deva |
Neerlandês | nl |
Latn |
Português | en |
Latn |
Esperanto | eo |
Latn |
Estónio | et |
Latn |
Faroense | fo |
Latn |
Fijiano | fj |
Latn |
Finlandês | fi |
Latn |
Francês | fr |
Latn |
Galego | gl |
Latn |
Georgiano | ka |
Gujr |
Alemão | de |
Latn |
Grego | el |
Grek |
Guzerate | gu |
Gujr , Latn |
Haitiano | ht |
Latn |
Hausa | ha |
Latn |
Hebraico | he |
Hebr |
Hindi | hi |
Deva , Latn |
Hmong Daw | mww |
Latn |
Húngaro | hu |
Latn |
Islandês | is |
Latn |
Igbo | ig |
Latn |
Indonésio | id |
Latn |
Inuktitut | iu |
Cans , Latn |
Inuinnaqtun | ikt |
Latn |
Irlandês | ga |
Latn |
Italiano | it |
Latn |
Japonês | ja |
Jpan |
Javanês | jv |
Latn |
Canarês | kn |
Knda , Latn |
Caxemira | ks |
Arab , Deva , Shrd |
Cazaque | kk |
Cyrl |
Kinyarwanda | rw |
Latn |
Quirguiz | ky |
Cyrl |
Konkani | gom |
Deva |
Coreano | ko |
Hang |
Curdo | ku |
Arab |
Curdo (do Norte) | kmr |
Latn |
Laos | lo |
Laoo |
Latim | la |
Latn |
Letão | lv |
Latn |
Lituano | lt |
Latn |
Baixa Sibéria | dsb |
Latn |
Luxemburguês | lb |
Latn |
Macedónio | mk |
Cyrl |
Maithili | mai |
Deva |
Malgaxe | mg |
Latn |
Malaio | ms |
Latn |
Malaiala | ml |
Mlym , Latn |
Maltês | mt |
Latn |
Maori | mi |
Latn |
Marata | mr |
Deva , Latn |
Meitei | mni |
Mtei |
Mongol | mn |
Cyrl , Mong |
Nepalês | ne |
Deva |
Norueguês | no |
Latn |
Norueguês (Nynorsk) | nn |
Latn |
Odia | or |
Orya , Latn |
Pashto | ps |
Arab |
Persa | fa |
Arab |
Polaco | pl |
Latn |
Português | pt |
Latn |
Punjabi | pa |
Guru , Latn |
Queretaro Otomi | otq |
Latn |
Romeno | ro |
Latn |
Russo | ru |
Cyrl |
Samoano | sm |
Latn |
Sanscrit | sa |
Deva |
Santali | sat |
Olck |
Sérvio | sr |
Latn , Cyrl |
Shona | sn |
Latn |
Sindhi | sd |
Arab |
Cingalês | si |
Sinh |
Eslovaco | sk |
Latn |
Esloveno | sl |
Latn |
Somali | so |
Latn |
Espanhol | es |
Latn |
Sundanês | su |
Latn |
Suaíli | sw |
Latn |
Sueco | sv |
Latn |
Tagalog | tl |
Latn |
Taitiano | ty |
Latn |
Tajique | tg |
Cyrl |
Tâmil | ta |
Taml , Latn |
Tatar | tt |
Cyrl |
Telugu | te |
Telu , Latn |
Tailandês | th |
Thai |
Tibetano | bo |
Tibt |
Tigrínia | ti |
Ethi |
Tonga | to |
Latn |
Turco | tr |
Latn |
Turquemenistão | tk |
Latn |
Alto Sorábio | hsb |
Latn |
Uigur | ug |
Arab |
Ucraniano | uk |
Latn |
Urdu | ur |
Arab , Latn |
Usbeque | uz |
Latn |
Vietnamita | vi |
Latn |
Galês | cy |
Latn |
Xhosa | xh |
Latn |
Iídiche | yi |
Hebr |
Iorubá | yo |
Latn |
Iucatego | yua |
Latn |
Zulu | zu |
Latn |
Idiomas Índicos Romanizados suportados pela Deteção de Idiomas
Linguagem | Código do Idioma |
---|---|
Assamês | as |
Bengalês | bn |
Guzerate | gu |
Hindi | hi |
Canarês | kn |
Malaiala | ml |
Marata | mr |
Odia | or |
Punjabi | pa |
Tâmil | ta |
Telugu | te |
Urdu | ur |
Deteção de scripts
Idioma | Código de script | Scripts |
---|---|---|
Assamês | as |
Latn , Beng |
Bengalês | bn |
Latn , Beng |
Guzerate | gu |
Latn , Gujr |
Hindi | hi |
Latn , Deva |
Canarês | kn |
Latn , Knda |
Malaiala | ml |
Latn , Mlym |
Marata | mr |
Latn , Deva |
Oriya | or |
Latn , Orya |
Punjabi | pa |
Latn , Guru |
Tâmil | ta |
Latn , Taml |
Telugu | te |
Latn , Telu |
Urdu | ur |
Latn , Arab |
Tatar | tt |
Latn , Cyrl |
Sérvio | sr |
Latn , Cyrl |
Inuktitut | iu |
Latn , Cans |