Návrh architektury umělé inteligence (AI)
Umělá inteligence (AI) je technologie, která umožňuje počítačům napodobovat inteligentní lidské chování. S AI můžou počítače:
- Analyzujte data a vytvářejte obrázky a videa.
- Analýza a syntetizace řeči
- Slovní interakce přirozenými způsoby.
- Vytvořte předpovědi a vygenerujte nová data.
Architekti navrhují úlohy, které používají umělou inteligenci k provádění funkcí nebo rozhodování, kdy by tradiční logika nebo zpracování byla zakázána nebo dokonce téměř nemožné implementovat. Jako architekt, který navrhuje řešení, je důležité porozumět prostředí umělé inteligence a strojového učení a tomu, jak Azure nabízí řešení pro integraci do návrhu úloh.
Koncepty AI
Algoritmy
Algoritmy nebo algoritmy strojového učení jsou části kódu, které pomáhají lidem zkoumat, analyzovat a hledat význam ve složitých datových sadách. Každý algoritmus je konečnou sadou jednoznačných podrobných instrukcí, podle kterých může počítač postupovat, aby dosáhl konkrétního cíle. Cílem modelu strojového učení je vytvořit nebo zjistit vzory, které mohou lidé použít k vytváření předpovědí nebo kategorizaci informací. Algoritmus může popsat, jak určit, jestli je zvíře kočkou, psem, rybou, ptákem nebo ještěrkou. Další mnohem složitější algoritmus může popsat, jak identifikovat napsaný nebo mluvený jazyk, analyzovat jeho slova, přeložit je do jiného jazyka a pak zkontrolovat přesnost překladu.
Při návrhu úlohy budete muset vybrat rodinu algoritmů, která je vhodná pro váš úkol, a vyhodnotit různé dostupné algoritmy, abyste našli odpovídající velikost.
Strojové učení
Strojové učení je technika umělé inteligence, která používá algoritmy k vytváření prediktivních modelů. Algoritmus se používá k analýze datových polí a k "učení" z dat pomocí vzorů nalezených v ní k vygenerování modelů. Tyto modely se pak používají k provádění informovaných předpovědí nebo rozhodování o nových datech.
Prediktivní modely se ověřují na základě známých dat měřených podle metrik výkonu vybraných pro konkrétní obchodní scénáře a podle potřeby se upraví. Tento proces učení a ověřování se nazývá trénování. Díky pravidelnému přetrénování se modely ML v průběhu času vylepšují.
Pokud jde o návrh úloh, zvažte použití strojového učení, pokud máte situaci, kdy se minulé pozorování dají spolehlivě použít k předpovídání budoucích situací. Tyto pozorování můžou být univerzální pravdy, jako je počítačové zpracování obrazu, které detekuje jednu formu zvířete z jiného, nebo tato pozorování můžou být specifická pro vaši situaci, jako je počítačové zpracování obrazu, které detekuje potenciální chybu sestavení na linkách sestavení na základě dat o minulých žádostech o záruku.
Hluboké učení
Hluboké učení je typ STROJOVÉho učení , který se může učit prostřednictvím vlastního zpracování dat. Podobně jako strojové učení používá také algoritmy k analýze dat, ale používá k tomu umělé neurální sítě, které obsahují mnoho vstupů, výstupů a vrstev zpracování. Každá vrstva může zpracovávat data jiným způsobem a výstupem jedné vrstvy se stane vstup pro další. Díky tomu může hluboké učení vytvářet složitější modely než tradiční strojové učení.
Jako návrhář úloh tato možnost vyžaduje velkou investici do generování vysoce přizpůsobených nebo průzkumných modelů. Obecně řečeno, před přidáním hloubkového učení do úlohy zvažte další řešení uvedená v tomto článku.
Generativní AI
Generateive AI je forma umělé inteligence, ve které jsou modely natrénovány tak, aby generovaly nový původní obsah na základě mnoha forem obsahu, jako je přirozený jazyk, počítačové zpracování obrazu, zvuk nebo vstup obrázku. Pomocí generující umělé inteligence můžete popsat požadovaný výstup v normálním každodenním jazyce a model může reagovat vytvořením vhodného textu, obrázku, kódu a dalších. Mezi příklady generativních aplikací umělé inteligence patří:
Microsoft Copilot je primárně uživatelské rozhraní, které pomáhá uživatelům při psaní kódu, dokumentů a dalšího textového obsahu. Je založená na oblíbených modelech OpenAI a je integrovaná do široké škály aplikací a uživatelských prostředí Microsoftu.
Azure OpenAI je vývojová platforma jako služba, která poskytuje přístup k výkonným jazykovým modelům OpenAI, jako je o1-preview, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo s vision, GPT-4, GPT-3.5-Turbo a řada modelů vkládání. Tyto modely je možné přizpůsobit konkrétnímu úkolu, například:
- Generování obsahu
- Shrnutí obsahu
- Rozpoznávání obrázků
- Sémantické vyhledávání
- Překlad kódu v přirozeném jazyce.
Jazykové modely
Jazykové modely jsou podmnožinou generativní umělé inteligence, která se zaměřuje na úlohy zpracování přirozeného jazyka (NLP), jako je generování textu a analýza mínění. Tyto modely představují přirozený jazyk na základě pravděpodobnosti slov nebo sekvencí slov, ke kterým dochází v daném kontextu.
Konvenční jazykové modely se používají v nastaveních pod dohledem pro účely výzkumu, kde jsou modely natrénovány na dobře označených textových datových sadách pro konkrétní úlohy. Předem vytrénované jazykové modely nabízejí přístupný způsob, jak začít pracovat s AI a v posledních letech se široce používaly. Tyto modely se trénují na rozsáhlých textových korporech z internetu pomocí neurálních sítí hlubokého učení a dají se doladit na menších datových sadách pro konkrétní úlohy.
Velikost jazykového modelu je určena počtem parametrů nebo váhy, které určují, jak model zpracovává vstupní data a generuje výstup. Parametry se během trénovacího procesu naučíte tak, že upravíte váhy v rámci vrstev modelu, abyste minimalizovali rozdíl mezi predikcemi modelu a skutečnými daty. Čím více parametrů model má, tím složitější a výraznější je, ale také výpočetně dražší je trénování a používání.
Obecně platí, že malé jazykové modely mají méně než 10 miliard parametrů a velké jazykové modely mají více než 10 miliard parametrů. Například řada modelů Microsoft Phi-3 má tři verze s různými velikostmi: mini (3,8 miliardy parametrů), malé (7 miliard parametrů) a střední (14 miliard parametrů).
Kopírky
Dostupnost jazykových modelů vedla ke vzniku nových způsobů interakce s aplikacemi a systémy prostřednictvím digitálních copilotů a připojených agentů specifických pro doménu. Copilots jsou generující asistenti umělé inteligence, kteří jsou integrováni do aplikací často jako chatovací rozhraní. Poskytují kontextovou podporu pro běžné úlohy v těchto aplikacích.
Microsoft Copilot je integrovaný do široké škály aplikací a uživatelských prostředí Společnosti Microsoft. Je založená na otevřené architektuře, která vývojářům třetích stran umožňuje vytvářet vlastní moduly plug-in, aby rozšířili nebo přizpůsobili uživatelské prostředí pomocí Microsoft Copilotu. Vývojáři třetích stran navíc můžou vytvářet vlastní kopírky pomocí stejné otevřené architektury.
Načítání rozšířené generace (RAG)
Načtení rozšířené generace (RAG) je model architektury, který rozšiřuje možnosti velkého jazykového modelu (LLM), jako je ChatGPT, který byl trénován pouze na veřejných datech. Tento model umožňuje přidat systém načítání, který poskytuje relevantní podkladová data v kontextu s požadavkem uživatele. Když přidáte systém načítání informací, budete mít kontrolu nad uzemněním dat používaných jazykovým modelem, když formuluje odpověď. Architektura RAG pomáhá vymezit obor generující AI na obsah, který pochází z vektorizovaných dokumentů, obrázků a dalších formátů dat. RAG není omezena na úložiště vektorového vyhledávání, ale vzor je použitelný ve spojení s jakoukoli technologií úložiště dat.
Automatizované strojové učení (AutoML)
Automatizované strojové učení, označované také jako automatizované strojové učení nebo AutoML, je proces automatizace časově náročných iterativních úloh vývoje modelů strojového učení. Umožňuje datovým vědcům, analytikům a vývojářům vytvářet modely ML s vysokou škálovatelností, efektivitou a produktivitou při zachování kvality modelu.
Služby AI
S vývojáři a organizacemi služeb Azure AI můžou vytvářet inteligentní, připravené a zodpovědné aplikace s předem připravenými, předem připravenými a přizpůsobitelnými rozhraními API a modely. Mezi využití patří zpracování přirozeného jazyka pro konverzace, vyhledávání, monitorování, překlad, řeč, vizi a rozhodování.
MLflow je opensourcová architektura navržená pro správu kompletního životního cyklu strojového učení.
Jazykové modely AI
Velké jazykové modely (LLMs), jako jsou modely GPT OpenAI, jsou výkonné nástroje, které můžou generovat přirozený jazyk napříč různými doménami a úlohami. Při zvažování použití těchto modelů zvažte faktory, jako jsou ochrana osobních údajů v datech, etické použití, přesnost a předsudky.
Otevřené modely Phi jsou malé, méně náročné na výpočetní výkon pro generování řešení umělé inteligence. Malý jazykový model (SLM) může být efektivnější, interpretovatelný a vysvětlitelný než velký jazykový model.
Při návrhu úlohy můžete jazykové modely používat jako hostované řešení, za měřeným rozhraním API nebo pro mnoho malých jazykových modelů, které můžete hostovat v procesu nebo alespoň na stejném výpočetním prostředí jako příjemce. Při používání jazykových modelů ve vašem řešení zvažte výběr jazykového modelu a jeho dostupných možností hostování, abyste zajistili použití optimalizovaného řešení pro váš případ použití.
Vývojové platformy a nástroje umělé inteligence
Azure Machine Learning Service
Azure Machine Learning je služba strojového učení pro sestavování a nasazování modelů. Azure Machine Learning nabízí webová rozhraní a sady SDK, abyste mohli trénovat a nasazovat modely a kanály strojového učení ve velkém měřítku. K těmto funkcím můžete přistupovat z opensourcových architektur Pythonu, jako jsou PyTorch, TensorFlow a scikit-learn.
Co je Azure Machine Learning? Obecná orientace s odkazy na mnoho výukových materiálů, sad SDK, dokumentace a dalších
Referenční architektury strojového učení pro Azure
Základní referenční architektura pro chat OpenAI je referenční architektura , která ukazuje, jak vytvořit komplexní architekturu chatu s modely GPT openAI.
Základní architektura chatu Azure OpenAI v cílové zóně Azure ukazuje, jak vytvořit základní architekturu Azure OpenAI, která řeší změny a očekávání při nasazení do cílové zóny Azure.
Zprovoznění strojového učení (MLOps) pro modely Pythonu pomocí služby Azure Machine Learning
Dávkové vyhodnocování modelů strojového učení Sparku v Azure Databricks
Automatizované strojové učení (AutoML)
Vytvářejte modely ML ve velkém měřítku pomocí funkce AutoML ve službě Azure Machine Learning k automatizaci úloh.
Domovská stránka produktu Automatizované strojové učení Azure
Konfigurace experimentů automatizovaného strojového učení v Pythonu
MLflow
Pracovní prostory Azure Machine Learning jsou kompatibilní s MLflow, což znamená, že pracovní prostor Azure Machine Learning můžete použít stejným způsobem jako server MLflow. Tato kompatibilita má následující výhody:
- Azure Machine Learning nehostuje instance serverů MLflow, ale může přímo používat rozhraní API MLflow.
- Pracovní prostor Azure Machine Learning můžete použít jako sledovací server pro jakýkoli kód MLflow bez ohledu na to, jestli běží ve službě Azure Machine Learning. MLflow stačí nakonfigurovat tak, aby odkazovali na pracovní prostor, kde by mělo dojít ke sledování.
- Můžete spustit jakoukoli rutinu trénování, která používá MLflow ve službě Azure Machine Learning, aniž byste museli provádět změny.
Další informace najdete v tématu MLflow a Azure Machine Learning.
Nástroje pro generování umělé inteligence
Tok výzvy je sada vývojových nástrojů navržená tak, aby zjednodušila kompletní vývojový cyklus generačních aplikací umělé inteligence od ideace, vytváření prototypů, testování, hodnocení až po produkční nasazení a monitorování. Podporuje přípravu výzvy prostřednictvím vyjádření akcí v modulárním orchestračním a tokovém modulu.
Azure AI Studio pomáhá experimentovat, vyvíjet a nasazovat generující aplikace a rozhraní API zodpovědně s komplexní platformou. S Azure AI Studio máte přístup ke službám Azure AI, základním modelům, dětskému prostředí a prostředkům, které vám pomůžou vytvářet, trénovat, vyladit a nasazovat modely AI. Můžete také vyhodnotit odpovědi modelu a orchestrovat komponenty aplikací s tokem výzvy, aby se zlepšil výkon.
Azure Copilot Studio se používá k rozšíření Microsoft Copilotu v Microsoftu 365 a vytváření vlastních kopírek pro interní a externí scénáře. Díky nástroji Copilot Studio můžou uživatelé navrhovat, testovat a publikovat kopírovací lístky pomocí komplexního plátna pro vytváření obsahu. Uživatelé můžou snadno vytvářet generující konverzace s podporou umělé inteligence, poskytovat větší kontrolu nad odpověďmi pro stávající kopírky a zrychlit produktivitu pomocí konkrétních automatizovaných pracovních postupů.
Datové platformy pro AI
Microsoft Fabric
Microsoft Fabric je komplexní analytická a datová platforma navržená pro podniky, které vyžadují jednotné řešení. Týmům úloh je možné udělit přístup k datům v těchto systémech. Zahrnuje přesun, zpracování, příjem dat, transformaci, směrování událostí v reálném čase a vytváření sestav. Nabízí komplexní sadu služeb, včetně Datoví technici ingu, služby Data Factory, Datová Věda, analýzy v reálném čase, datového skladu a databází.
Microsoft Fabric integruje samostatné komponenty do soudržného zásobníku. Místo toho, abyste se spoléhali na různé databáze nebo datové sklady, můžete centralizovat úložiště dat pomocí OneLake. Možnosti umělé inteligence jsou vložené do prostředků infrastruktury a eliminují potřebu ruční integrace.
Použití Azure OpenAI v prostředcích infrastruktury s rozhraním REST API
Použití Microsoft Fabric pro generativní AI: Průvodce vytvářením a vylepšováním systémů RAG
Kopírovací grafy v prostředcích infrastruktury
Funkce Copilot a další generující umělé inteligence umožňují transformovat a analyzovat data, generovat přehledy a vytvářet vizualizace a sestavy v Microsoft Fabric a Power BI. Můžete buď vytvořit vlastní kopírku, nebo zvolit jeden z následujících předem připravených zkopírovaných objektů:
Dovednosti umělé inteligence v prostředcích infrastruktury
S dovedností Microsoft Fabric AI můžete nakonfigurovat systém generující umělou inteligenci tak, aby generoval dotazy, které odpovídají na otázky týkající se vašich dat. Jakmile nakonfigurujete dovednost umělé inteligence, můžete ji sdílet se svými kolegy, kteří se pak mohou ptát v prosté angličtině. Na základě jejich otázek generuje umělá inteligence dotazy na vaše data, která odpovídají na tyto otázky.
- Co je dovednost umělé inteligence v prostředcích infrastruktury? (Preview)
- Jak vytvořit dovednost umělé inteligence
- Příklad dovednosti AI
- Rozdíl mezi dovednostmi AI a kopírovaným grafem
Datové platformy založené na Apache Sparku pro AI
Apache Spark je architektura pro paralelní zpracování, která podporuje zpracování v paměti pro zvýšení výkonu aplikací pro analýzu velkých objemů dat. Spark poskytuje primitivy pro clusterové výpočty v paměti. Úloha Sparku může načítat a ukládat data do paměti a dotazovat se na ni opakovaně, což je rychlejší než aplikace založené na disku, jako je Hadoop.
Apache Spark v Azure Fabric
Microsoft Fabric Runtime je platforma integrovaná v Azure založená na Apache Sparku, která umožňuje spouštění a správu dat a prostředí pro datové vědy. Kombinuje klíčové komponenty z interních i opensourcových zdrojů a poskytuje zákazníkům komplexní řešení.
Hlavní komponenty modulu runtime fabric:
Apache Spark – výkonná opensourcová distribuovaná výpočetní knihovna, která umožňuje rozsáhlé úlohy zpracování a analýzy dat. Apache Spark poskytuje univerzální a vysoce výkonnou platformu pro datové inženýrství a prostředí pro datové vědy.
Delta Lake – opensourcová vrstva úložiště, která do Apache Sparku přináší transakce ACID a další funkce spolehlivosti dat. Delta Lake integrovaná v prostředí Fabric Runtime vylepšuje možnosti zpracování dat a zajišťuje konzistenci dat napříč několika souběžnými operacemi.
Balíčky na úrovni výchozí úrovně pro balíčky Java/Scala, Python a R – které podporují různé programovací jazyky a prostředí. Tyto balíčky se instalují a konfigurují automaticky, což vývojářům umožňuje použít upřednostňované programovací jazyky pro úlohy zpracování dat.
Modul Runtime Microsoft Fabric je založený na robustním opensourcovém operačním systému, který zajišťuje kompatibilitu s různými konfiguracemi hardwaru a požadavky na systém.
Azure Databricks Runtime pro Machine Learning
Azure Databricks je analytická platforma založená na Apache Sparku s nastavením jedním kliknutím, zjednodušenými pracovními postupy a interaktivním pracovním prostorem pro spolupráci mezi datovými vědci, inženýry a obchodními analytiky.
Databricks Runtime pro Machine Learning (Databricks Runtime ML) umožňuje spustit cluster Databricks se všemi knihovnami potřebnými pro distribuované trénování. Poskytuje prostředí pro strojové učení a datové vědy. Navíc obsahuje několik oblíbených knihoven, včetně TensorFlow, PyTorch, Keras a XGBoost. Podporuje také distribuované trénování s využitím Horovodu.
Apache Spark ve službě Azure HDInsight
Apache Spark v Azure HDInsight je implementace Apache Sparku v cloudu od Microsoftu. Clustery Spark v HDInsight jsou kompatibilní se službou Azure Storage a Azure Data Lake Storage, takže ke zpracování dat uložených v Azure můžete použít clustery HDInsight Spark.
Knihovna strojového učení Microsoftu pro Apache Spark je SynapseML (dříve označovaná jako MMLSpark). Tato opensourcová knihovna přidává do ekosystému Spark mnoho nástrojů hlubokého učení a datových věd, síťových funkcí a výkonu na produkční úrovni. Přečtěte si další informace o funkcích a možnostech SynapseML.
Přehled služby Azure HDInsight Základní informace o funkcích, architektuře clusteru a případech použití s ukazateli na rychlé starty a kurzy
Kurz: Vytvoření aplikace strojového učení Apache Spark ve službě Azure HDInsight
Konfigurace nastavení clusteru Apache Spark ve službě HDInsight
Úložiště GitHub pro SynapseML: Knihovna strojového učení Microsoftu pro Apache Spark
Vytvoření kanálu strojového učení Apache Spark ve službě HDInsight
Úložiště dat pro AI
Microsoft Fabric OneLake
OneLake in Fabric je jednotné a logické datové jezero, které je přizpůsobené celé organizaci. Slouží jako centrální centrum pro všechna analytická data a je součástí každého tenanta Microsoft Fabric. OneLake in Fabric je postaven na základu Data Lake Storage Gen2.
OneLake v prostředcích infrastruktury:
- Podporuje strukturované a nestrukturované typy souborů.
- Ukládá všechna tabulková data ve formátu Delta Parquet.
- Poskytuje jedno datové jezero v rámci hranic tenantů, které se ve výchozím nastavení řídí.
- Podporuje vytváření pracovních prostorů v rámci tenanta, aby organizace mohl distribuovat zásady vlastnictví a přístupu.
- Podporuje vytváření různých datových položek, jako jsou jezera a sklady, ze kterých máte přístup k datům.
Další informace najdete v tématu OneLake, OneDrive pro data.
Azure Data Lake Storage Gen2
Azure Data Lake Storage je jediné centralizované úložiště, ve kterém můžete ukládat všechna data strukturovaná i nestrukturovaná. Datové jezero umožňuje vaší organizaci rychle a snadněji ukládat, přistupovat k datům a analyzovat širokou škálu dat v jednom umístění. U datového jezera nemusíte odpovídat datům, aby vyhovovala existující struktuře. Místo toho můžete data ukládat v nezpracovaný nebo nativní formát, obvykle jako soubory nebo jako binární velké objekty (objekty blob).
Data Lake Storage Gen2 poskytuje sémantiku systému souborů, zabezpečení na úrovni souborů a škálování. Vzhledem k tomu, že tyto funkce jsou založené na úložišti objektů blob, získáte také nízkonákladové vrstvené úložiště s možnostmi vysoké dostupnosti nebo zotavení po havárii.
Data Lake Storage Gen2 představuje Azure Storage základ pro vytváření podnikových datových jezer v Azure. Data Lake Storage Gen2 umožňuje snadnou správu obrovských objemů dat od začátku až po obsluhu několika petabajtů informací a současně udržovat stovky gigabitů propustnosti.
- Seznámení se službou Azure Data Lake Storage
- Kurz: Azure Data Lake Storage, Azure Databricks a Spark
Zpracování dat pro AI
Microsoft Fabric Data Factory
Pomocí služby Data Factory můžete ingestovat, připravovat a transformovat data z více zdrojů dat (například databáze, datový sklad, Lakehouse, data v reálném čase a další). Při návrhu úloh se jedná o nástroj, který může být instrumentální při plnění vašich požadavků na DataOps.
Data Factory podporuje řešení kódu i bez/nízkého kódu:
Datové kanály umožňují vytvářet možnosti pracovního postupu v cloudovém měřítku. Pomocí datových kanálů můžete pomocí rozhraní pro přetahování vytvářet pracovní postupy, které můžou aktualizovat tok dat, přesouvat petabajtová data a definovat kanály toku řízení.
Toky dat poskytují rozhraní s nízkým kódem pro příjem dat ze stovek zdrojů dat a transformaci dat pomocí 300+ transformací dat.
Další zdroje informací:
Azure Databricks
S platformou Databricks Data Intelligence Platform můžete napsat kód pro vytvoření pracovního postupu strojového učení pomocí přípravy funkcí:
- Datové kanály ingestují nezpracovaná data, vytvářejí tabulky funkcí, trénují modely a provádějí dávkové odvozování. Při trénování a protokolování modelu pomocí přípravy funkcí v katalogu Unity se model zabalí s metadaty funkcí. Když použijete model pro dávkové vyhodnocování nebo online odvozování, automaticky načte hodnoty funkcí. Volající o nich nemusí vědět nebo zahrnout logiku pro vyhledání nebo spojení funkcí, aby mohli ohodnocet nová data.
- Koncové body obsluhy modelů a funkcí jsou k dispozici jediným kliknutím a poskytují latenci v milisekundách.
- Monitorování dat a modelů
Můžete také použít Rozhraní AI Vector Search, které je optimalizované pro ukládání a načítání vložených objektů. Vkládání je zásadní pro aplikace, které vyžadují vyhledávání podobnosti, jako je RAG (Retrieval Augmented Generation), systémy doporučení a rozpoznávání obrázků.
Datové konektory pro AI
Kanály Azure Data Factory a Azure Synapse Analytics podporují mnoho úložišť a formátů dat prostřednictvím aktivit kopírování, Tok dat, vyhledávání, získávání metadat a odstraňování. Informace o dostupných konektorech úložiště dat, podporovaných funkcích a odpovídajících konfiguracích a obecných možnostech připojení ODBC najdete v přehledu konektoru Azure Data Factory a Azure Synapse Analytics.
Vlastní AI
Azure Machine Learning
Azure Machine Learning je cloudová služba pro urychlení a správu životního cyklu projektu strojového učení (ML). Odborníci na strojové učení, datoví vědci a technici ho můžou použít ve svých každodenních pracovních postupech k trénování a nasazování modelů a správě operací strojového učení (MLOps).
Azure Machine Learning nabízí následující možnosti:
Výběr algoritmu: Některé algoritmy dělají konkrétní předpoklady o struktuře dat nebo požadovaných výsledcích. Pokud najdete ten, který vyhovuje vašim potřebám, může vám poskytnout užitečnější výsledky, přesnější předpovědi nebo rychlejší časy trénování.
Ladění nebo optimalizace hyperparametrů je proces vyhledání konfigurace hyperparametrů, které mají za následek nejlepší výkon. Proces je výpočetně nákladný a ruční. Hyperparametry jsou nastavitelné parametry, které umožňují řídit proces trénování modelu. Například u neurálních sítí rozhodujete o počtu skrytých vrstev a počtu uzlů v každé vrstvě. Výkon modelu závisí silně na hyperparametrech.
Azure Machine Learning umožňuje automatizovat ladění hyperparametrů a paralelně spouštět experimenty za účelem efektivní optimalizace hyperparametrů.
Trénování modelu Pomocí služby Azure Machine Learning můžete iterativním způsobem používat algoritmus k vytváření nebo učení modelů. Po vytrénování je pak možné tyto modely použít k analýze dat, ze kterých se dají predikce provádět. Během trénovací fáze se označí sada známých dat kvality, aby bylo možné identifikovat jednotlivá pole. Označená data se předá algoritmu nakonfigurovaným pro vytvoření konkrétní předpovědi. Po dokončení algoritmus vypíše model, který popisuje vzory nalezené jako sadu parametrů. Během ověřování se označí nová data a použijí se k otestování modelu. Algoritmus se upraví podle potřeby a případně provede další trénování. Fáze testování používá data z reálného světa bez jakýchkoli značek nebo předem vybraných cílů. Za předpokladu, že jsou výsledky modelu přesné, považuje se za připravené k použití a lze je nasadit.
Automatizované strojové učení (AutoML) je proces automatizace časově náročných iterativních úloh vývoje modelů strojového učení. Může výrazně zkrátit dobu potřebnou k získání modelů ML připravených pro produkční prostředí. Automatizované strojové učení může pomoct s výběrem modelu, laděním hyperparametrů, trénováním modelu a dalšími úlohami bez nutnosti rozsáhlého programování nebo znalosti domény.
Automatizované strojové učení můžete použít, když chcete, aby služba Azure Machine Learning trénování a ladění modelu používala zadanou cílovou metriku. Automatizované strojové učení je možné použít bez ohledu na odborné znalosti datových věd k identifikaci kompletního kanálu strojového učení pro jakýkoli problém.
Odborníci na strojové učení a vývojáři v různých odvětvích můžou automatizované strojové učení používat k:
Implementace řešení ML bez rozsáhlého programování nebo znalostí strojového učení
Úspora času a prostředků
Použití osvědčených postupů pro datové vědy
Poskytování agilního řešení problémů
Bodování se také nazývá predikce a je proces generování hodnot na základě natrénovaného modelu strojového učení vzhledem k některým novým vstupním datům. Vytvořené hodnoty nebo skóre mohou představovat předpovědi budoucích hodnot, ale mohou také představovat pravděpodobnou kategorii nebo výsledek.
Příprava funkcí a featurizace Trénovací data se skládají z řádků a sloupců. Každý řádek je pozorování nebo záznam a sloupce každého řádku jsou funkcemi, které popisují jednotlivé záznamy. Funkce, které nejlépe charakterizují vzory v datech, jsou obvykle vybrány k vytváření prediktivních modelů.
I když mnoho nezpracovaných datových polí lze použít přímo k trénování modelu, je často nutné vytvořit další (vytvořené) funkce, které poskytují informace, které lépe rozlišují vzory v datech. Tento proces se označuje jako inženýring funkcí, kde se k vytváření funkcí používá použití znalostí domény k vytváření funkcí, které zase pomáhají algoritmům strojového učení lépe se učit.
Ve službě Azure Machine Learning se používají techniky škálování a normalizace dat, které usnadňují přípravu funkcí. Tyto techniky a tato příprava funkcí se souhrnně označují jako featurizace v experimentech automatizovaného strojového učení (ML).
Azure OpenAI
Služba Azure OpenAI umožňuje přizpůsobit modely OpenAI vašim osobním datovým sadám pomocí procesu označovaného jako jemné ladění. Tento krok přizpůsobení vám umožní získat více ze služby tím, že poskytuje:
- Vyšší kvalita výsledků než to, co můžete získat pouze z příkazového inženýrství
- Možnost trénovat na více příkladech, než se vejde do limitu maximálního počtu požadavků modelu.
- Úspory tokenů z důvodu kratších výzev
- Požadavky s nižší latencí, zejména při použití menších modelů.
Další informace naleznete v tématu:
- Přizpůsobení modelu pomocí jemného ladění
- Kurz podrobného ladění Azure OpenAI GPT-4o-mini
- Základní referenční architektura pro chat OpenAI
Služby Azure AI pro vlastní AI
Služby Azure AI nabízejí funkce, které umožňují vytvářet vlastní modely a aplikace AI. Tato část obsahuje přehled některých z těchto klíčových funkcí.
Custom Speech
Vlastní řeč je funkce služby Azure AI Speech. Pomocí vlastní řeči můžete vyhodnotit a zlepšit přesnost rozpoznávání řeči pro vaše aplikace a produkty. Vlastní model řeči se dá použít pro převod řeči v reálném čase na text, překlad řeči a dávkový přepis.
Rozpoznávání řeči využívá univerzální jazykový model jako základní model trénovaný s daty vlastněnými Microsoftem a odráží běžně používaný mluvený jazyk. Základní model je předem natrénovaný pomocí dialektů a fonetik představujících různé společné domény. Když provedete žádost o rozpoznávání řeči, použije se ve výchozím nastavení nejnovější základní model pro každý podporovaný jazyk. Základní model funguje dobře ve většině scénářů rozpoznávání řeči.
Vlastní model lze použít k rozšíření základního modelu za účelem zlepšení rozpoznávání slovníku specifického pro doménu specifickou pro aplikaci poskytnutím textových dat pro trénování modelu. Dá se také použít ke zlepšení rozpoznávání na základě konkrétních zvukových podmínek aplikace poskytnutím zvukových dat s referenčními přepisy.
Model se strukturovaným textem můžete vytrénovat také v případě, že se data řídí vzorem, určíte vlastní výslovnost a přizpůsobíte formátování textu pomocí vlastního inverzního normalizace textu, vlastního přepisu a vlastního filtrování vulgárních výrazů.
Custom Translator
Custom Translator je funkce služby Azure AI Translator . Díky custom Translatoru můžou podniky, vývojáři aplikací a poskytovatelé jazykových služeb vytvářet přizpůsobené systémy pro neurální strojový překlad (NMT). Přizpůsobené systémy překladu se bezproblémově integrují do stávajících aplikací, pracovních postupů a webů.
Platforma umožňuje uživatelům vytvářet a publikovat vlastní systémy překladu do a z angličtiny. Custom Translator podporuje více než tři desítky jazyků, které se mapuje přímo na jazyky dostupné pro NMT. Úplný seznam najdete v tématu Podpora jazyka Translator.
Custom Translator nabízí následující funkce:
Funkce | Popis |
---|---|
Použití technologie neurálního strojového překladu | Vylepšete překlad použitím neurálního strojového překladu (NMT) poskytovaného vlastním překladačem. |
Vytváření systémů, které ví vaši obchodní terminologii | Přizpůsobte a sestavte systémy překladu pomocí paralelních dokumentů, které rozumí terminologii používané ve vaší firmě a oboru. |
Vytvoření modelů pomocí slovníku | Pokud nemáte trénovací sadu dat, můžete model trénovat jenom s daty slovníku. |
Spolupráce s ostatními | Spolupracujte s týmem sdílením práce s různými lidmi. |
Přístup k vlastnímu modelu překladu | K vlastnímu modelu překladu se dostanete kdykoli pomocí stávajících aplikací nebo programů prostřednictvím rozhraní Microsoft Translator Text API V3. |
Vlastní modely Document Intelligence
Azure AI Document Intelligence používá pokročilou technologii strojového učení k identifikaci dokumentů, zjišťování a extrahování informací z formulářů a dokumentů a vrácení extrahovaných dat ve strukturovaném výstupu JSON. Pomocí funkce Document Intelligence můžete použít modely analýzy dokumentů, předem připravené nebo předem natrénované nebo vytrénované samostatné vlastní modely.
Vlastní modely Document Intelligence teď obsahují vlastní klasifikační modely pro scénáře, ve kterých potřebujete před vyvoláním modelu extrakce identifikovat typ dokumentu. Klasifikační model je možné spárovat s vlastním modelem extrakce a analyzovat a extrahovat pole z formulářů a dokumentů specifických pro vaši firmu. Samostatné vlastní modely extrakce je možné kombinovat a vytvářet složené modely.
Vlastní nástroje AI
I když předem připravené modely AI jsou užitečné a stále flexibilnější, nejlepším způsobem, jak získat to, co potřebujete, je vytvořit model přizpůsobený vašim konkrétním potřebám. Existují dva hlavní nástroje pro vytváření vlastních modelů AI: Generování umělé inteligence a tradiční strojové učení:
Studio Azure Machine Learning
studio Azure Machine Learning je cloudová služba pro urychlení a správu životního cyklu projektu strojového učení (ML). Odborníci na strojové učení, datoví vědci a technici ho můžou použít ve svých každodenních pracovních postupech k trénování a nasazování modelů a správě operací strojového učení (MLOps).:
- Sestavte a vytrénujte model Azure Machine Learning s libovolným typem výpočetních prostředků, včetně Sparku a GPU pro rozsáhlé úlohy AI v cloudovém měřítku.
- Spusťte automatizované rozhraní Azure Machine Learning (AutoML) a přetahování myší pro Azure Machine Learning s nízkým kódem.
- Implementujte kompletní kanály Azure Machine LearningOps a opakovatelné kanály Azure Machine Learning.
- Pro detekci předsudků a analýzu chyb použijte zodpovědný řídicí panel AI.
- Orchestrace a správa toků výzev a LLM
- Nasaďte modely s koncovými body rozhraní REST API, v reálném čase a dávkovým odvozováním.
- Pomocí Hubs (Preview) můžete sdílet výpočetní prostředky, kvótu, zabezpečení a připojení k prostředkům společnosti se skupinou pracovních prostorů a zároveň centralizovat zásady správného řízení pro IT. Nastavte centrum jednou a pak vytvořte zabezpečené pracovní prostory přímo ze studia pro každý projekt. Pomocí center můžete spravovat práci vašeho týmu v sadě ML Studio i VI Studiu.
Azure AI Studio
Azure AI Studio je navržený tak, aby vám pomohl efektivně sestavovat a nasazovat vlastní aplikace AI s využitím široké nabídky AI Azure:
- Sestavte společně jako jeden tým. Centrum AI Studio poskytuje zabezpečení na podnikové úrovni a prostředí pro spolupráci se sdílenými prostředky a připojeními k předem natrénovaným modelům, datům a výpočetním prostředkům.
- Uspořádejte svou práci. Projekt AI Studio vám pomůže uložit stav, což vám umožní iterovat od prvního nápadu k prvnímu prototypu a pak k prvnímu produkčnímu nasazení. Na této cestě můžete také snadno pozvat ostatní, aby spolupracovali.
- Použijte upřednostňovanou vývojovou platformu a architektury, včetně GitHubu, Visual Studio Code, LangChain, Sémantického jádra, AutoGenu a dalších.
- Objevte a proveďte srovnávací testy z více než 1 600 modelů.
- Zřiďte modely jako službu (MaaS) prostřednictvím bezserverových rozhraní API a hostovaného jemného ladění.
- Začlenit více modelů, zdrojů dat a způsoby.
- Sestavte načítání rozšířené generace (RAG) pomocí chráněných podnikových dat bez nutnosti doladit.
- Orchestrace a správa toků výzev a velkých jazykových modelů (LLM)
- Návrh a ochrana aplikací a rozhraní API s konfigurovatelnými filtry a ovládacími prvky
- Vyhodnoťte odpovědi modelu pomocí integrovaných a vlastních toků hodnocení.
- Nasaďte inovace AI do spravované infrastruktury Azure s průběžným monitorováním a zásadami správného řízení napříč prostředími.
- Nepřetržitě monitorujte nasazené aplikace z hlediska bezpečnosti, kvality a spotřeby tokenů v produkčním prostředí.|
Podrobné porovnání mezi Azure Machine Learning a Azure AI Studio najdete v tématu Azure Machine Learning vs. Azure AI Studio.
Vyzvání toku v Azure AI Studiu
Tok výzvy v Azure AI Studiu je vývojový nástroj navržený tak, aby zjednodušil celý vývojový cyklus aplikací AI využívajících velké jazykové modely (LLM). Tok instrukcí poskytuje komplexní řešení, které zjednodušuje proces vytváření prototypů, experimentování, iterace a nasazování aplikací umělé inteligence.
- Tok výzvy je funkce, která se dá použít k vygenerování, přizpůsobení nebo spuštění toku.
- Tok je spustitelná instrukční sada, která může implementovat logiku AI. Toky je možné vytvářet nebo spouštět prostřednictvím několika nástrojů, jako je předem připravené plátno, LangChain atd. Iterace toku lze uložit jako prostředky; po nasazení toku se stane rozhraním API. Ne všechny toky jsou toky výzvy; Místo toho je tok výzvy jedním ze způsobů, jak vytvořit tok.
- Výzva je balíček vstupu odeslaný do modelu, který se skládá ze vstupu uživatele, systémové zprávy a všech příkladů. Uživatelský vstup je text odeslaný v okně chatu. Systémová zpráva je sada instrukcí pro určení jeho chování a funkčnosti modelu.
- Ukázkový tok je jednoduchý předem připravený tok orchestrace, který ukazuje, jak toky fungují, a lze je přizpůsobit.
- Ukázkový příkazový řádek je definovaná výzva pro konkrétní scénář, který lze zkopírovat z knihovny a použít ji jako nebo upravit v návrhu výzvy.
Vlastní jazyky kódu AI
Základním konceptem AI je použití algoritmů k analýze dat a generování modelů, které popisují (nebo skóre) způsobem, který je užitečný. Algoritmy píší vývojáři a datoví vědci (a někdy i jinými algoritmy) pomocí programovacího kódu. Dva z nejoblíbenějších programovacích jazyků pro vývoj umělé inteligence jsou v současné době Python a R.
Python je univerzální programovací jazyk vysoké úrovně. Má jednoduchou snadnou syntaxi, která zdůrazňuje čitelnost. Neexistuje žádný kompilovací krok. Python má velkou standardní knihovnu, ale podporuje také možnost přidávat moduly a balíčky. To podporuje modularitu a umožňuje v případě potřeby rozšířit možnosti. Existuje rozsáhlý a rostoucí ekosystém knihoven AI a ML pro Python, včetně mnoha snadno dostupných v Azure.
Úvod do strojového učení s využitím Pythonu a Azure Notebooks
scikit-learn
. Opensourcová knihovna ML pro PythonPyTorch. Opensourcová knihovna Pythonu s bohatým ekosystémem, který lze použít pro hluboké učení, počítačové zpracování obrazu, zpracování přirozeného jazyka a další
TensorFlow: Open source symbolická matematická knihovna používaná také pro aplikace ML a neurální sítě
Kurz: Použití modelů strojového učení ve službě Azure Functions pomocí Pythonu a TensorFlow
R je jazyk a prostředí pro statistické výpočty a grafiku. Dá se použít pro všechno od mapování rozsáhlých sociálních a marketingových trendů online až po vývoj finančních a klimatických modelů.
Microsoft plně přijal programovací jazyk R a nabízí vývojářům jazyka R mnoho různých možností, jak spustit kód v Azure.
Interaktivní použití jazyka R ve službě Azure Machine Learning
Kurz: Vytvoření logistického regresního modelu v R pomocí Azure Machine Learning
Obecné informace o vlastní umělé inteligenci v Azure
Microsoft AI na GitHubu: Ukázky, referenční architektury a osvědčené postupy
Poznámkové bloky sady Python SDK služby Azure Machine Learning Úložiště GitHub s ukázkovými poznámkovými bloky, které demonstrují sadu Azure Machine Learning Python SDK.
Případové studie
Různá odvětví používají AI inovativními a inspirujícími způsoby. Následuje několik případových studií zákazníků a úspěšných scénářů:
- Volkswagen: Strojový překlad hovořící Volkswagen - v 40 jazycích
- Zdravotnictví pro všechny s využitím Kry s využitím Azure Open AI
- PIMCO zvyšuje klientskou službu s využitím vyhledávací platformy založené na umělé inteligenci založené na Azure AI.
- Legrand a služba Azure OpenAI: Powering smarter solutions with AI-driven tools
- C.H. Robinson překonat desetiletí staré překážky automatizace logistického průmyslu pomocí Azure AI
Procházet další příběhy zákazníků AI
Obecné informace o umělé inteligenci Microsoftu
Přečtěte si další informace o umělé inteligenci Microsoftu a mějte aktuální informace o souvisejících novinkách:
Další kroky
Další informace o produktech pro vývoj umělé inteligence od Microsoftu najdete v tématu Microsoft AI.
Školení týkající se vývoje řešení AI najdete v centru výuky AI.
Microsoft AI na GitHubu: Ukázky, referenční architektury a osvědčené postupy uspořádají opensourcová úložiště založená na umělé inteligenci Microsoftu a poskytují kurzy a výukové materiály.
Najděte diagramy architektury a popisy technologií pro referenční architektury řešení AI.