Analýza textu
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
tento článek popisuje moduly pro analýzu textu zahrnuté v Machine Learning studiu (classic). Tyto moduly poskytují specializované výpočetní nástroje pro práci s strukturovaným i nestrukturovaným textem, včetně:
- Více možností pro předzpracování textu.
- Rozpoznávání jazyka.
- Vytváření funkcí z textu pomocí přizpůsobitelných slovníků n-gramů.
- Funkce hash pro efektivní analýzu textu bez předběžného zpracování nebo rozšířené jazykové analýzy.
- Pro dostupné pro velmi rychlé strojové učení s textem. Pro dostupné podporuje funkci hashing funkcí, modelování témat (LDA) a klasifikaci.
- Rozpoznávání pojmenovaných entit pro extrakci názvů osob, míst a organizací z nestrukturovaného textu.
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Příklady
příklady analýz textu pomocí Machine Learning najdete v Azure AI Gallery:
Kategorizace zpráv: používá funkci hashing funkcí ke klasifikaci článků do předdefinovaného seznamu kategorií.
Najít podobné společnosti: k kategorizaci společností používá text článků Wikipedii.
Klasifikace textu: demonstruje kompletní proces používání textu ze zpráv Twitteru v mínění analýze (ukázka pěti částí).
Seznam modulů
kategorie Analýza textu v Machine Learning studiu (classic) zahrnuje tyto moduly:
- Detekovat jazyky: detekuje jazyk každého řádku ve vstupním souboru.
- Extrahovat klíčové fráze z textu: extrahuje klíčové fráze z daného textu.
- Extrakce n-gramových funkcí z textu: vytvoří funkce slovníku n-gramů a v nich provede výběr funkcí.
- Funkce hashing: převede textová data na celočíselně zakódované funkce pomocí knihovny dostupné pro.
- Dirichletův přidělování latentních: provádí modelování tématu pomocí knihovny dostupné pro pro LDA.
- Rozpoznávání pojmenovaných entit: rozpoznává pojmenované entity v textovém sloupci.
- Text předběžného zpracování: provádí čisticí operace s textem.
- Skore pro dostupné 7-4: hodnocení vstupu z Azure pomocí verze 7-4 pro systému Machine Learning dostupné.
- Skore pro dostupné 7-10: hodnocení vstupu z Azure pomocí verze 7-10 pro systému Machine Learning dostupné.
- Skore pro dostupné 8 model: vyhodnotí vstup z Azure pomocí verze 8 pro dostupné systému Machine Learning.
- Pro model dostupné 7-4: Naškolímodel pomocí verze 7-4 pro systému Machine Learning dostupné.
- Pro model dostupné 7-10: Naškolímodel pomocí verze 7-10 pro systému Machine Learning dostupné.
- Pro dostupné 8 model: Naškolímodel pomocí verze 8 systému Machine Learning pro dostupné.