Návrh architektury AI
AI je technologie, která umožňuje počítačům napodobovat inteligentní lidské chování. Počítače můžou používat AI k:
- Analyzujte data a vytvářejte obrázky a videa.
- Analýza a syntetizace řeči
- Slovní interakce přirozenými způsoby.
- Vytvořte předpovědi a vygenerujte nová data.
AI můžete začlenit do aplikací, abyste mohli provádět funkce nebo rozhodovat, že tradiční logika nebo zpracování nedokáže efektivně zvládnout. Jako architekt, který navrhuje řešení, je důležité pochopit prostředí umělé inteligence a strojového učení a jak integrovat řešení Azure do návrhu úloh.
Začněte
Azure Architecture Center poskytuje ukázkové architektury, příručky k architektuře, směrné plány architektury a nápady, které můžete použít ve vašem scénáři. Úlohy, které zahrnují komponenty umělé inteligence a strojového učení, by měly postupovat podle pokynů pro Azure Framework Well-Architected a AI workloads . Tyto pokyny zahrnují principy a průvodce návrhem, které ovlivňují úlohy umělé inteligence a strojového učení napříč pěti pilíři architektury. Tato doporučení byste měli implementovat ve scénářích a obsahu v Centru architektury Azure.
Koncepty AI
Koncepty umělé inteligence zahrnují širokou škálu technologií a metodologií, které umožňují počítačům provádět úlohy, které obvykle vyžadují lidskou inteligenci. Následující části obsahují přehled klíčových konceptů umělé inteligence.
Algoritmy
algoritmy nebo algoritmy strojového učení jsou části kódu, které pomáhají lidem zkoumat, analyzovat a hledat význam v komplexních datových sadách. Každý algoritmus je konečná sada jednoznačných podrobných instrukcí, podle nichž může počítač dosáhnout konkrétního cíle. Cílem modelu strojového učení je vytvořit nebo zjistit vzory, které mohou lidé použít k vytváření předpovědí nebo kategorizaci informací. Algoritmus může popsat, jak určit, jestli je zvíře kočkou, psem, rybou, ptákem nebo ještěrkou. Další mnohem složitější algoritmus může popsat, jak identifikovat napsaný nebo mluvený jazyk, analyzovat jeho slova, přeložit je do jiného jazyka a pak zkontrolovat přesnost překladu.
Vyberte si rodinu algoritmů, která nejlépe vyhovuje vašemu úkolu. Vyhodnoťte různé algoritmy v rámci rodiny, abyste našli vhodné řešení pro vaši úlohu. Další informace najdete v tématu Co jsou algoritmy strojového učení?.
Strojové učení
Strojové učení je technika umělé inteligence, která používá algoritmy k vytváření prediktivních modelů. Tyto algoritmy parsují datová pole a "učí se" ze vzorů v rámci dat za účelem generování modelů. Modely pak můžou provádět informované předpovědi nebo rozhodnutí na základě nových dat.
Prediktivní modely se ověřují proti známým datům, měří se metrikami výkonu pro konkrétní obchodní scénáře a pak se podle potřeby upraví. Tento proces učení a ověřování se nazývá trénování. Díky pravidelnému přetrénování se modely strojového učení v průběhu času vylepšují.
Při návrhu úloh můžete použít strojové učení, pokud váš scénář obsahuje předchozí pozorování, která můžete spolehlivě použít k předpovídání budoucích situací. Tyto pozorování mohou být univerzální pravdy, jako je počítačové zpracování obrazu, které detekuje jednu formu zvířete z jiného. Tato pozorování mohou být specifická pro vaši situaci, například počítačové vidění, které zjistí potenciální chybu sestavení na vašich výrobních linkách na základě dat o minulých reklamacích.
Další informace najdete v tématu Co je strojové učení?.
Hluboké učení
hluboké učení je typ strojového učení, který se může učit prostřednictvím vlastního zpracování dat. Podobně jako strojové učení používá algoritmy k analýze dat. Analyzuje ale data prostřednictvím umělých neurálních sítí, které obsahují mnoho vstupů, výstupů a vrstev zpracování. Každá vrstva může zpracovávat data jiným způsobem. Výstupem jedné vrstvy se stane vstup pro další. Tento proces umožňuje hluboké učení vytvářet složitější modely než tradiční strojové učení.
Hluboké učení vyžaduje velké investice pro generování vysoce přizpůsobených nebo průzkumných modelů. Než do úlohy přidáte hloubkové učení, můžete zvážit další řešení v tomto článku.
Další informace najdete v tématu Co je hluboké učení?.
Generativní AI
Generativní AI trénuje modely tak, aby generovaly původní obsah na základě mnoha forem obsahu, jako je zpracování přirozeného jazyka, počítačové vidění, zvuk nebo obrázky. Pomocí generující umělé inteligence můžete popsat požadovaný výstup v každodenním jazyce a model může reagovat vytvořením vhodného textu, obrázku a kódu. Mezi příklady generativních aplikací AI patří Microsoft Copilot a Azure OpenAI Service.
Copilot je primárně uživatelské rozhraní, které pomáhá psát kód, dokumenty a další textový obsah. Je založená na oblíbených modelech OpenAI a je integrovaná do široké škály aplikací a uživatelských prostředí Microsoftu.
Azure OpenAI je vývojová platforma jako služba, která poskytuje přístup k výkonným jazykovým modelům OpenAI, jako jsou o1-preview, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo s vizí, GPT-4, GPT-3.5-Turbo a modelové řady Embeddings. Tyto modely můžete přizpůsobit vašim konkrétním úkolům, například:
- Generování obsahu
- Shrnutí obsahu
- Porozumění obrázkům
- Sémantické vyhledávání.
- Překlad kódu v přirozeném jazyce.
Jazykové modely
jazykové modely jsou podmnožinou generující umělé inteligence, která se zaměřuje na úlohy zpracování přirozeného jazyka, jako je generování textu a analýza mínění. Tyto modely představují přirozený jazyk na základě pravděpodobnosti slov nebo sekvencí slov, ke kterým dochází v daném kontextu.
Konvenční jazykové modely se používají v nastaveních pod dohledem pro účely výzkumu, kde jsou modely natrénovány na dobře označených textových datových sadách pro konkrétní úlohy. Předem natrénované jazykové modely nabízejí přístupný způsob, jak začít používat AI. V posledních letech se častěji používají. Tyto modely se trénují na rozsáhlých kolekcích textu z internetu prostřednictvím neurálních sítí hlubokého učení. Můžete je vyladit u menších datových sad pro konkrétní úkoly.
Počet parametrů nebo váhy určují velikost jazykového modelu. Parametry ovlivňují, jak model zpracovává vstupní data a generuje výstup. Během trénování model upraví váhy, aby minimalizoval rozdíl mezi jeho predikcemi a skutečnými daty. Tímto procesem se model učí parametry. Čím více parametrů model má, tím složitější a výraznější je. Je ale také výpočetně nákladnější pro trénování a používání.
Obecně platí, že malé jazykové modely mají obecně méně než 10 miliard parametrů a velké jazykové modely mají více než 10 miliard parametrů. Řada modelů Microsoft Phi-3 má například tři verze:
- Mini, 3,8 miliardy parametrů
- Malý, 7 miliard parametrů
- Střední, 14 miliard parametrů
Další informace viz katalog jazykových modelů.
Kopírky
Dostupnost jazykových modelů vedla ke vzniku nových způsobů interakce s aplikacemi a systémy prostřednictvím digitálních copilotů a připojených agentů specifických pro doménu. Copilots jsou generující asistenti umělé inteligence, kteří se integrují do aplikací, často jako chatovací rozhraní. Poskytují kontextovou podporu pro běžné úlohy v těchto aplikacích.
Microsoft Copilot se integruje s širokou škálou aplikací a uživatelských prostředí Microsoftu. Je založená na otevřené architektuře, ve které můžou vývojáři, kteří nejsou od Microsoftu, vytvářet vlastní moduly plug-in, aby rozšířili nebo přizpůsobili uživatelské prostředí pomocí Copilotu. Vývojáři partneři mohou také vytvářet vlastní kopiloty pomocí stejné otevřené architektury.
Další informace najdete v následujících zdrojích informací:
- Přijetí, rozšíření a vytváření prostředí Copilota v rámci platformy Microsoft Cloud
-
Copilot Studio - Azure AI Foundry
Načtení rozšířené generace
Generování obohacené načítáním (RAG) je vzor architektury, který rozšiřuje možnosti velkého jazykového modelu (LLM), jako je ChatGPT, který je trénován pouze na veřejných datech. Tento model můžete použít k přidání systému načítání, který poskytuje relevantní podkladová data v kontextu s požadavkem uživatele. Systém načítání informací poskytuje kontrolu nad uzemněním dat, která jazykový model používá při formulaci odpovědi. Architektura RAG pomáhá vymezit obor generující AI na obsah, který pochází z vektorizovaných dokumentů, obrázků a dalších formátů dat. RAG se neomezuje na úložiště vektorových vyhledávání. Můžete použít libovolnou technologii úložiště dat.
Další informace najdete v tématu Návrh a vývoj řešení RAG a Volba služby Azure pro vektorové vyhledávání.
Služby Azure AI
S službami Azure AImohou vývojáři a organizace používat hotová, předem sestavená a přizpůsobitelná rozhraní API a modely k vytváření inteligentních, pro trh připravených a odpovědných aplikací. Případy použití zahrnují zpracování přirozeného jazyka pro konverzace, vyhledávání, monitorování, překlad, řeč, vizi a rozhodování.
Další informace najdete v následujících zdrojích informací:
- Volba technologie služeb Azure AI
- Dokumentace ke službám Azure AI
- Volba technologie zpracování přirozeného jazyka v Azure
Jazykové modely AI
LLMs, jako jsou modely OpenAI GPT, jsou výkonné nástroje, které můžou generovat přirozený jazyk napříč různými doménami a úlohami. Pokud chcete zvolit model, zvažte faktory, jako je ochrana osobních údajů, etické použití, přesnost a předsudky.
Otevřené modely Phi jsou malé, méně náročné na výpočetní výkon pro generování řešení umělé inteligence. Malý jazykový model může být efektivnější, interpretovatelný a vysvětlitelný než LLM.
Při návrhu úlohy můžete jazykové modely používat jako hostované řešení za měřeným rozhraním API. Pro mnoho malých jazykových modelů můžete také hostovat jazykové modely v procesu nebo alespoň na stejném výpočetním prostředí jako příjemce. Při používání jazykových modelů ve vašem řešení zvažte výběr jazykového modelu a jeho dostupných možností hostování, abyste zajistili optimalizované řešení pro váš případ použití.
Vývojové platformy a nástroje umělé inteligence
Následující vývojové platformy a nástroje umělé inteligence vám můžou pomoct sestavovat, nasazovat a spravovat modely strojového učení a AI.
Azure Machine Learning
Azure Machine Learning je služba strojového učení, kterou můžete použít k vytváření a nasazování modelů. Machine Learning nabízí webová rozhraní a sady SDK, abyste mohli trénovat a nasazovat modely a kanály strojového učení ve velkém měřítku. K těmto funkcím můžete přistupovat z opensourcových architektur Pythonu, jako jsou PyTorch, TensorFlow a scikit-learn.
Další informace najdete v následujících zdrojích informací:
- Porovnání produktů a technologií strojového učení Microsoftu
- dokumentace k strojovému učení
- Co je Machine Learning?
Referenční architektury strojového učení pro Azure
základní architektura chatu Azure OpenAI v cílové zóně Azure
Dávkové vyhodnocování modelů strojového učení Sparku v Azure Databricks
Základní referenční architektura end-to-end chatu OpenAI je referenční architektura, která popisuje, jak vytvořit end-to-end architekturu chatu za použití modelů GPT od OpenAI.
Automatizované strojové učení
Automatizované strojové učení (AutoML) je proces automatizace časově náročných iterativních úloh vývoje modelů strojového učení. Datoví vědci, analytici a vývojáři můžou pomocí AutoML vytvářet modely strojového učení, které mají vysokou škálovatelnost, efektivitu a produktivitu při zachování kvality modelu.
Další informace najdete v následujících zdrojích informací:
- Co je AutoML?
- Kurz : Trénování klasifikačního modelu pomocí AutoML v nástroji Machine Learning Studio
- konfigurace experimentů AutoML v Pythonu
- Použití rozšíření rozhraní příkazového řádku pro službu Machine Learning
MLflow
Pracovní prostory Machine Learning jsou kompatibilní s MLflow, což znamená, že pracovní prostor Machine Learning můžete použít stejným způsobem jako server MLflow. Tato kompatibilita poskytuje následující výhody:
- Machine Learning nehostuje instance serveru MLflow, ale může přímo používat rozhraní API MLflow.
- Pracovní prostor Machine Learning můžete použít jako sledovací server pro jakýkoli kód MLflow bez ohledu na to, jestli běží ve službě Machine Learning. Musíte nakonfigurovat MLflow tak, aby odkazovali na pracovní prostor, kde by mělo dojít ke sledování.
- Můžete spouštět rutiny trénování, které používají MLflow ve službě Machine Learning, aniž byste museli provádět změny.
Další informace naleznete v tématu MLflow a Machine Learning a MLflow.
Nástroje pro generování umělé inteligence
Prompt flow je sada vývojových nástrojů, které můžete použít ke zjednodušení kompletního vývojového cyklu generativních aplikací umělé inteligence, od ideace, vytváření prototypů, testování a hodnocení až po nasazení do produkce a monitorování. Podporuje přípravu výzvy prostřednictvím vyjádření akcí v modulárním orchestračním a tokovém modulu.
Azure AI Foundry vám pomůže odpovědně experimentovat, vyvíjet a nasazovat aplikace a rozhraní API využívající generativní AI díky komplexní platformě. Portál AI Foundry poskytuje přístup ke službám Azure AI, základním modelům, dětskému prostředí a prostředkům, které vám pomůžou vytvářet, trénovat, vyladit a nasazovat modely AI. Můžete také vyhodnotit odpovědi modelu a orchestraci komponent aplikace výzev s řízením toků výzev pro lepší výkon.
Copilot Studio rozšiřuje Copilot v Microsoftu 365. Pomocí Copilot Studio můžete vytvářet vlastní kopiloty pro interní a externí scénáře. Pro navrhování, testování a publikování kopilotů použijte komplexní autorský nástroj. Můžete snadno vytvářet konverzace s generativní umělou inteligencí, poskytovat větší kontrolu nad odpověďmi pro stávající kopiloty a zvýšit produktivitu pomocí automatizovaných pracovních postupů.
Datové platformy pro AI
Následující platformy nabízejí komplexní řešení pro přesun dat, zpracování, příjem, transformaci, analýzu v reálném čase a reporting.
Microsoft Fabric
Microsoft Fabric je komplexní analytická a datová platforma pro podniky, které vyžadují jednotné řešení. Týmům zabývajícím se pracovní zátěží můžete udělit přístup k datům v rámci Fabricu. Platforma se zabývá přesunem, zpracováním, příjmem dat, transformací, směrováním událostí v reálném čase a vytvářením sestav. Nabízí komplexní sadu služeb, včetně Fabric Data Engineer, Fabric Data Factory, Fabric Data Science, Fabric Real-Time Intelligence, Fabric Data Warehouse a Fabric Databases.
Síťová architektura integruje samostatné komponenty do soudržné vrstvy. Místo toho, abyste se spoléhali na různé databáze nebo datové sklady, můžete centralizovat úložiště dat pomocí OneLake. Funkce AI jsou vložené do Fabricu, což eliminuje potřebu ruční integrace.
Další informace najdete v následujících zdrojích informací:
- Co je Fabric?
- Studijní program : Začínáme s Fabric
- Služby AI v prostředcích infrastruktury
- Použití Azure OpenAI v prostředcích infrastruktury s rozhraním REST API
- Použití technologie Fabric pro generativní AI: Průvodce vytvářením a zlepšováním systémů RAG
- Vytváření vlastních AI aplikací pomocí Fabric: implementace RAG pro vylepšené jazykové modely
Kopírovací grafy v prostředcích infrastruktury
Pomocí Copilot a dalších funkcí generativní umělé inteligence můžete transformovat a analyzovat data, generovat přehledy a vytvářet vizualizace a sestavy v Fabric a Power BI. Můžete vytvořit vlastního copilot nebo zvolit jeden z následujících již připravených copilotů:
- Copilot ve Fabricu
- Kopilot pro datovou vědu a datové inženýrství
- Copilot pro Data Factory
- Copilot pro datový sklad
- Copilot pro Power BI
- Copilot pro inteligentní funkce v reálném čase
Dovednosti umělé inteligence v prostředcích infrastruktury
Pomocí funkce dovedností Fabric AI můžete nakonfigurovat systém generující umělou inteligenci ke generování dotazů, které odpovídají na otázky týkající se vašich dat. Jakmile nakonfigurujete dovednost umělé inteligence, můžete ji sdílet se svými kolegy, kteří se pak mohou ptát v jednoduchém jazyce. Na základě jejich otázek generuje AI dotazy na data, která na tyto otázky odpovídají.
Další informace najdete v následujících zdrojích informací:
- Co je funkce dovednosti AI ve Fabricu?
- Jak vytvořit dovednost AI
- Příklad dovednosti AI
- Rozdíl mezi dovednostmi AI a kopírovaným grafem
Datové platformy založené na Apache Sparku pro AI
Apache Spark je architektura pro paralelní zpracování, která podporuje zpracování v paměti pro zvýšení výkonu aplikací pro analýzu velkých objemů dat. Spark poskytuje základní stavební bloky pro výpočetní prostředí clusteru v paměti. Úloha Sparku může načítat a ukládat data do paměti a dotazovat se na ni opakovaně, což je rychlejší než aplikace založené na disku, jako je Hadoop.
Apache Spark v Microsoft Fabric
Fabric Runtime je platforma integrovaná v Azure založená na Apache Sparku, která umožňuje implementaci a správu prostředí přípravy dat a datových věd. Modul fabric Runtime kombinuje klíčové komponenty z interních a opensourcových zdrojů, které poskytují komplexní řešení.
Runtime Fabric má následující klíčové komponenty:
Apache Spark je výkonná opensourcová distribuovaná výpočetní knihovna, která umožňuje rozsáhlé úlohy zpracování a analýzy dat. Apache Spark poskytuje univerzální a vysoce výkonnou platformu pro datové inženýrství a prostředí pro datové vědy.
Delta Lake je opensourcová vrstva úložiště, která integruje transakce atomicity, konzistence, izolace a odolnosti (ACID) a další funkce spolehlivosti dat s Apache Sparkem. Delta Lake integrovaná v prostředí Fabric Runtime vylepšuje možnosti zpracování dat a pomáhá zajistit konzistenci dat napříč několika souběžnými operacemi.
balíčky výchozí úrovně pro Javu, Scalu, Python a R jsou balíčky, které podporují různé programovací jazyky a prostředí. Tyto balíčky se instalují a konfigurují automaticky, takže vývojáři můžou pro úlohy zpracování dat použít upřednostňované programovací jazyky.
Prostředí Fabric Runtime je postavené na robustním opensourcovém operačním systému, který pomáhá zajistit kompatibilitu s různými konfiguracemi hardwaru a požadavky na systém.
Další informace naleznete v běhových prostředích Apache Spark ve Fabricu.
Azure Databricks Runtime pro Machine Learning
Azure Databricks je analytická platforma založená na Apache Sparku, která má nastavení jedním kliknutím, zjednodušené pracovní postupy a interaktivní pracovní prostor pro spolupráci mezi datovými vědci, inženýry a obchodními analytiky.
Ke spuštění clusteru Databricks se všemi knihovnami potřebnými k distribuovanému trénování můžete použít Databricks Runtime pro Machine Learning. Tato funkce poskytuje prostředí pro strojové učení a datové vědy. Obsahuje několik oblíbených knihoven, včetně TensorFlow, PyTorch, Keras a XGBoost. Podporuje také distribuované trénování prostřednictvím Horovodu.
Další informace najdete v následujících zdrojích informací:
- Dokumentace ke službě Azure Databricks
- Možnosti strojového učení v Azure Databricks
- Dávkové vyhodnocování modelů strojového učení Sparku v Azure Databricks
- Přehled hlubokého učení pro Azure Databricks
Apache Spark ve službě Azure HDInsight
Apache Spark v Azure HDInsight je implementace Apache Sparku v cloudu od Microsoftu. Clustery Spark v HDInsight jsou kompatibilní se službou Azure Storage a Azure Data Lake Storage, takže ke zpracování dat uložených v Azure můžete použít clustery HDInsight Spark.
SynapseML, dříve označované jako MMLSpark, je knihovna strojového učení Microsoftu pro Apache Spark. Tato opensourcová knihovna přidává do ekosystému Spark mnoho nástrojů hlubokého učení a datových věd, síťových funkcí a výkonu na produkční úrovni.
Další informace najdete v následujících zdrojích informací:
- funkce a možnosti SynapseML
- Přehled HDInsight
- Kurz : Vytvoření aplikace strojového učení Apache Spark ve službě HDInsight
- Osvědčené postupy Pro Apache Spark ve službě HDInsight
- Nastavení konfigurace clusteru Apache Spark HDInsight
- Vytvoření kanálu strojového učení Apache Spark ve službě HDInsight
Úložiště dat pro AI
Následující platformy můžete použít k efektivnímu ukládání, přístupu a analýze velkých objemů dat.
Fabric OneLake
OneLake in Fabric je jednotné a logické datové jezero, které můžete přizpůsobit celé organizaci. Slouží jako centrální centrum pro všechna analytická data a je součástí každého tenanta Fabric. OneLake in Fabric je postaven na základu služby Data Lake Storage.
OneLake v prostředcích infrastruktury:
- Podporuje strukturované a nestrukturované typy souborů.
- Ukládá všechna tabulková data ve formátu Delta-Parquet.
- Poskytuje jedno datové jezero v rámci hranic tenantů, které se ve výchozím nastavení řídí.
- Podporuje vytváření pracovních prostorů v rámci tenanta, aby vaše organizace mohly distribuovat zásady vlastnictví a přístupu.
- Podporuje vytváření různých datových položek, jako jsou jezera a sklady, ze kterých máte přístup k datům.
Další informace najdete v tématu OneLake, OneDrive pro data.
Data Lake Storage
Data Lake Storage je jediné centralizované úložiště, do kterého můžete ukládat strukturovaná a nestrukturovaná data. Data Lake můžete použít k rychlému a snadnému ukládání, přístupu a analýze široké škály dat v jednom umístění. Nemusíte upravovat svá data, aby zapadla do existující struktury. Místo toho můžete data ukládat v nezpracovaných nebo nativních formátech, obvykle jako soubory nebo jako binární velké objekty nebo objekty blob.
Data Lake Storage poskytuje sémantiku systému souborů, zabezpečení na úrovni souborů a škálování. Vzhledem k tomu, že tyto funkce jsou založené na službě Azure Blob Storage, získáte také nízkonákladové vrstvené úložiště s vysokou dostupností a možnostmi zotavení po havárii.
Data Lake Storage využívá infrastrukturu služby Azure Storage k vytvoření základu pro vytváření podnikových datových jezer v Azure. Data Lake Storage může obsluhovat několik petabajtů informací a současně udržovat stovky gigabitů propustnosti, abyste mohli spravovat obrovské objemy dat.
Další informace najdete v následujících zdrojích informací:
Zpracování dat pro AI
Pomocí následujících nástrojů můžete připravit data pro aplikace strojového učení a AI. Ujistěte se, že jsou vaše data čistá a strukturovaná, abyste je mohli použít pro pokročilou analýzu.
Fabric Data Factory
Pomocí služby Fabric Data Factory můžete ingestovat, připravovat a transformovat data z více zdrojů dat, jako jsou databáze, datové sklady, jezera a datové proudy v reálném čase. Tato služba vám může pomoct splnit požadavky na operace s daty při návrhu úloh.
Služba Fabric Data Factory podporuje řešení zahrnující kód i řešení bez kódu nebo s nízkým množstvím kódu.
Pomocí datových kanálů můžete vytvářet funkce pracovních postupů v cloudovém měřítku. Pomocí rozhraní pro přetahování můžete vytvářet pracovní postupy, které můžou aktualizovat tok dat, přesouvat petabajtová data a definovat kanály toku řízení.
Používejte toky dat jako nízkokódové rozhraní k ingestování dat ze stovek zdrojů dat a jejich transformaci pomocí více než 300 datových transformací.
Další informace najdete v tématu úplný scénář služby Data Factory: Úvod a architektura.
Azure Databricks
Pomocí platformy Databricks Data Intelligence Platform můžete napsat kód pro vytvoření pracovního postupu strojového učení pomocí přípravy funkcí. inženýring funkcí je proces transformace nezpracovaných dat na funkce, které můžete použít k trénování modelů strojového učení. Databricks Data Intelligence Platform obsahuje klíčové funkce, které podporují přípravu funkcí:
Datové kanály přijímají nezpracovaná data, vytvářejí tabulky funkcí, trénují modely a provádějí dávkovou predikci. Pokud používáte inženýrství funkcí v katalogu Unity k trénování a protokolování modelu, je model zabalen s metadaty funkcí. Když použijete model pro dávkové vyhodnocování nebo online odvozování, automaticky načte hodnoty funkcí. Volající nemusí vědět o hodnotách ani implementovat logiku, aby vyhledal nebo připojil vlastnosti pro dosažení skóre nových dat.
Modely a koncové body pro poskytování funkcí jsou okamžitě přístupné a poskytují latenci v milisekundách.
monitorování pomáhá zajistit výkon a přesnost dat a modelů.
K ukládání a načítání vloženin můžete také použít Mosaic AI vyhledávání vektorů. Vkládání je zásadní pro aplikace, které vyžadují vyhledávání podobnosti, jako jsou RAG, systémy doporučení a rozpoznávání obrázků.
Další informace najdete v tématu Azure Databricks: Poskytování dat pro strojové učení aAI .
Datové konektory pro AI
Potrubí Azure Data Factory a Azure Synapse Analytics podporují mnoho úložišť a formátů dat prostřednictvím aktivit jako kopírování, tok dat, vyhledávání, získávání metadat a odstranění. Informace o dostupných konektorech úložiště dat, podporovaných funkcích včetně odpovídajících konfigurací, a obecné možnosti připojení Open Database Connectivity najdete v tématu přehled konektorů Azure Data Factory a Azure Synapse Analytics.
Vlastní AI
Vlastní řešení umělé inteligence pomáhají řešit konkrétní obchodní potřeby a výzvy. Následující části obsahují přehled různých nástrojů a služeb, které můžete použít k vytváření a správě vlastních modelů AI.
Azure Machine Learning
Azure Machine Learning je cloudová služba pro urychlení a správu životního cyklu projektu strojového učení. Odborníci na strojové učení, datoví vědci a technici můžou tuto službu používat ve svých každodenních pracovních postupech k trénování a nasazování modelů a správě operací strojového učení.
Machine Learning nabízí následující možnosti:
Výběr algoritmu: Některé algoritmy dělají konkrétní předpoklady o datové struktuře nebo požadovaných výsledcích. Zvolte algoritmus, který vyhovuje vašim potřebám, abyste mohli získat užitečnější výsledky, přesnější předpovědi a rychlejší trénování. Další informace najdete v tématu Jak vybrat algoritmy proMachine Learning .
ladění nebo optimalizace hyperparametrů: Tento ruční proces můžete použít k vyhledání konfigurací hyperparametrů, které vedou k nejlepšímu výkonu. Tato optimalizace způsobuje značné výpočetní náklady. Hyperparametry jsou určité nastavitelné parametry, které umožňují řízení v procesu učení modelu. Můžete například zvolit počet skrytých vrstev a počet uzlů v každé vrstvě neurálních sítí. Výkon modelu závisí silně na hyperparametrech.
Machine Learning můžete použít k automatizaci ladění hyperparametrů a spouštění experimentů paralelně za účelem efektivní optimalizace hyperparametrů.
Další informace najdete v následujících zdrojích informací:
- ladění modelu hyperparametrem pomocí služby Machine Learning
- Upgrade ladění hyperparametrů na sadu SDK v2
- Studijní program : Ladění hyperparametrů pomocí machine learningu
trénink modelu : Můžete iterativním způsobem použít algoritmus k vytváření nebo učení se modelů. Po natrénování modelů je můžete použít k analýze dat a vytváření předpovědí.
Během fáze trénování:
Sada kvality známých dat je označená tak, aby jednotlivá pole byla identifikovatelná.
Algoritmus, který je nakonfigurovaný tak, aby udělal konkrétní předpověď, přijímá označená data.
Algoritmus vypíše model, který zachycuje vzory, které identifikoval v datech. Model používá sadu parametrů k reprezentaci těchto vzorů.
Během ověřování:
Nová data jsou označená a slouží k otestování modelu.
Algoritmus se upraví podle potřeby a pravděpodobně provede další trénování.
Fáze testování používá data z reálného světa bez jakýchkoli značek nebo předem vybraných cílů. Pokud jsou výsledky modelu přesné, je připravené k použití a dá se nasadit.
Další informace najdete v následujících zdrojích informací:
AutoML: Tento proces automatizuje časově náročné iterativní úlohy vývoje modelů strojového učení. Může výrazně zkrátit dobu potřebnou k výrobě modelů strojového učení připravených pro produkční prostředí. AutoML může pomoct s výběrem modelu, laděním hyperparametrů, trénováním modelu a dalšími úlohami bez nutnosti rozsáhlého programování nebo znalosti domény.
AutoML můžete použít, když chcete, aby Machine Learning používala zadanou cílovou metriku k trénování a ladění modelu. K identifikaci kompletního kanálu strojového učení pro problémy nepotřebujete odborné znalosti datových věd.
Odborníci na strojové učení a vývojáři v různých odvětvích můžou autoML používat k:
- Implementujte řešení strojového učení bez rozsáhlého programování nebo znalostí strojového učení.
- Ušetřete čas a prostředky.
- Použijte osvědčené postupy pro datové vědy.
- Poskytovat agilní řešení problémů
Další informace najdete v tématu Co je AutoML?.
bodování: Tento proces, označovaný také jako predikce, používá naučený model strojového učení ke generování hodnot na základě nových vstupních dat. Hodnoty nebo skóre mohou představovat předpovědi budoucích hodnot, ale mohou také představovat pravděpodobnou kategorii nebo výsledek.
Další informace najdete v následujících zdrojích informací:
Příprava funkcí a featurizace: trénovací data se skládají z řádků a sloupců. Každý řádek je pozorování nebo záznam a sloupce každého řádku jsou funkcemi, které popisují jednotlivé záznamy. Funkce, které nejlépe charakterizují vzory v datech, jsou obvykle vybrány k vytváření prediktivních modelů.
I když k trénování modelu můžete použít mnoho nezpracovaných datových polí, možná budete muset vytvořit další vytvořené funkce, které poskytují informace pro lepší rozlišení vzorů v datech. Tento proces se nazývá příprava funkcí, kde pomocí znalostí domény dat vytváříte funkce, které pomáhají algoritmům strojového učení se lépe učit.
Ve službě Machine Learning se používají techniky škálování a normalizace dat, které usnadňují přípravu funkcí. Souhrnně se těmto technikám a zpracování vlastností říká featurizace v experimentech AutoML. Další informace najdete v tématu Featurizace dat v automatizovaném strojovém učení.
Azure OpenAI
V Azure OpenAI, můžete použít proces označovaný jako doladění k přizpůsobení modelů OpenAI vašim vlastním datovým sadám. Tento krok přizpůsobení optimalizuje službu tím, že poskytuje:
- Výsledky vyšší kvality ve srovnání s pouhým návrhem opatření.
- Možnost provádět školení na více příkladech, než obvykle umožňuje maximální kontextový limit požadavku modelu.
- Úspory tokenů z důvodu kratších výzev
- Požadavky s nižší latencí, zejména pokud používáte menší modely.
Další informace najdete v následujících zdrojích informací:
- Přizpůsobení modelu pomocí jemného ladění
- Kurz : Tutoriál na doladění Azure OpenAI GPT-4o-mini
- Základní referenční architektura pro chat OpenAI
Služby Azure AI pro vlastní AI
služby Azure AI poskytují funkce pro vytváření vlastních modelů a aplikací AI. Následující části obsahují přehled těchto klíčových funkcí.
Vlastní řeč
Vlastní řeč je funkce služby Azure AI Speech. Pomocí vlastní řeči můžete vyhodnotit a zlepšit přesnost rozpoznávání řeči pro vaše aplikace a produkty. Pro převod řeči na text v reálném čase, překlad řeči a dávkový přepis můžete použít vlastní model řeči.
Rozpoznávání řeči ve výchozím nastavení používá jako základní model univerzální jazykový model. Tento model se trénuje s daty vlastněnými Microsoftem a odráží běžně používaný mluvený jazyk. Základní model je předem natrénovaný pomocí dialektů a fonetik, které představují různé společné domény. Když provedete žádost o rozpoznávání řeči, použije se ve výchozím nastavení nejnovější základní model pro váš podporovaný jazyk. Základní model funguje dobře ve většině scénářů rozpoznávání řeči.
K rozšíření základního modelu můžete použít vlastní model. Můžete například zlepšit rozpoznávání slovníku specifického pro doménu, který je specifický pro aplikaci, poskytnutím textových dat pro trénování modelu. Rozpoznávání konkrétních zvukových podmínek aplikace můžete také vylepšit tím, že poskytnete zvuková data, včetně přepisů odkazů.
Pokud se data řídí vzorem, můžete k trénování modelu použít strukturovaný text. Můžete zadat vlastní výslovnost a přizpůsobit formátování zobrazovaného textu vlastní inverzní normalizací textu, vlastním přepisem a vlastním filtrováním vulgárních výrazů.
Vlastní překladač
custom translator je funkce služby Azure AI Translator. Podniky, vývojáři aplikací a poskytovatelé jazykových služeb můžou pomocí vlastního překladače vytvářet přizpůsobené systémy neurálního strojového překladu (NMT). Přizpůsobené systémy překladu se bezproblémově integrují do stávajících aplikací, pracovních postupů a webů.
Tuto funkci můžete použít k vytváření a publikování vlastních systémů překladu do a z angličtiny. Custom Translator podporuje více než tři desítky jazyků, které se mapují přímo na jazyky pro NMT. Úplný seznam jazyků najdete v tématu Podpora jazyka Translator.
Custom Translator nabízí následující funkce.
Funkce | Popis |
---|---|
použít technologii NMT | Použijte NMT z vlastního překladatele ke zlepšení vašeho překladu. |
Sestavte systémy, které využívají vaši obchodní terminologii | Přizpůsobte a sestavte systémy překladu pomocí paralelních dokumentů, které rozumí terminologii ve vaší firmě a oboru. |
Vytvoření modelů pomocí slovníku | Pokud nemáte trénovací datovou sadu, natrénujte model pouze s daty slovníku. |
Spolupráce s ostatními | Spolupracujte s týmem sdílením práce s různými lidmi. |
Přístup k vlastnímu modelu překladu | K vlastnímu modelu překladu můžete kdykoli přistupovat pomocí stávajících aplikací nebo programů prostřednictvím rozhraní Microsoft Translator Text API V3. |
Vlastní modely Azure AI Document Intelligence
Azure AI Document Intelligence používá pokročilou technologii strojového učení k identifikaci dokumentů, zjišťování a extrahování informací z formulářů a dokumentů a vrácení extrahovaných dat ve strukturovaném výstupu JSON. Využijte funkci Document Intelligence k využití předem připravených nebo předem natrénovaných modelů analýzy dokumentů nebo trénovaných samostatných vlastních modelů.
vlastní modely Document Intelligence zahrnují vlastní klasifikační modely pro scénáře, ve kterých je před vyvoláním modelu extrakce nutná identifikace typu dokumentu. Klasifikační model můžete spárovat s vlastním modelem extrakce a analyzovat a extrahovat pole z formulářů a dokumentů, které jsou specifické pro vaši firmu. Zkombinujte samostatné vlastní modely extrakce a vytvořte složené modely.
Vlastní nástroje AI
Předem připravené modely AI jsou užitečné a stále flexibilnější, ale nejlepším způsobem optimalizace AI je přizpůsobit model vašim konkrétním potřebám. Dva primární nástroje pro vytváření vlastních modelů AI jsou generující AI a tradiční strojové učení.
Studio Azure Machine Learning
Azure Machine Learning Studio je cloudová služba pro urychlení a správu životního cyklu projektu strojového učení. Odborníci na strojové učení, datoví vědci a technici ho můžou používat ve svých každodenních pracovních postupech k trénování a nasazování modelů a správě operací strojového učení.
Vytvářejte a trénujte modely Machine Learning pomocí libovolného typu výpočetních prostředků, včetně Sparku a GPU pro rozsáhlé úlohy umělé inteligence v cloudovém měřítku.
Spusťte AutoML a použijte uživatelské rozhraní pro přetahování pro strojové učení s nízkým kódem.
Implementujte kompletní operace strojového učení a opakovatelné kanály.
Pro detekci předsudků a analýzu chyb použijte příslušný řídicí panel AI.
Orchestrace a správa toků výzev a LLM
Nasaďte modely prostřednictvím koncových bodů rozhraní REST API, odvozování v reálném čase a dávkového odvozování.
Pomocí pracovních prostorů centra můžete sdílet výpočetní prostředky, kvótu, zabezpečení a připojení k prostředkům společnosti a současně centralizovat zásady správného řízení pro IT. Nastavte centrum jednou a pak vytvořte zabezpečené pracovní prostory přímo ze studia pro každý projekt. Použijte centra k zajištění správy práce týmu ve studiu a na portálu AI Foundry.
AI Foundry
AI Foundry pomáhá efektivně vytvářet a nasazovat vlastní aplikace generující AI s využitím široké nabídky Azure AI.
Sestavte společně jako jeden tým. Centrum AI Foundry poskytuje zabezpečení na podnikové úrovni a prostředí pro spolupráci, které zahrnuje sdílené prostředky a připojení k předem natrénovaným modelům, datům a výpočetním prostředkům.
Uspořádejte svou práci. Projekt AI Foundry vám pomůže uložit stav, abyste mohli iterovat od prvního nápadu k prvnímu prototypu a prvnímu produkčnímu nasazení. Snadno pozvěte ostatní, aby s vámi spolupracovali.
Použijte upřednostňovanou vývojovou platformu a architektury, včetně GitHubu, Visual Studio Code, LangChain, Sémantického jádra a AutoGenu.
Objevte a proveďte srovnávací testy z více než 1 600 modelů.
Zajištění modelů jako služby (MaaS) prostřednictvím bezserverových rozhraní API a hostovaného doladění.
Začlenit více modelů, zdrojů dat a způsoby.
Vytvářejte RAG pomocí chráněných podnikových dat, aniž byste museli jemně doladit.
Orchestrace a správa toků výzev a LLM
Návrh a ochrana aplikací a rozhraní API prostřednictvím konfigurovatelných filtrů a ovládacích prvků
Vyhodnoťte odpovědi modelu pomocí předdefinovaných a vlastních toků hodnocení.
Nasaďte inovace AI do infrastruktury spravované v Azure, abyste zajistili průběžné monitorování a zásady správného řízení napříč prostředími.
Nepřetržitě monitorujte nasazené aplikace pro zajištění bezpečnosti, kvality a spotřeby tokenů v produkčním prostředí.
Další informace najdete v tématu portálu AI Foundry oprotimachine learning studia .
Tok promptů v portálu AI Foundry
Prompt flow v AI Foundry portálu je vývojový nástroj, který můžete použít ke zjednodušení celého vývojového cyklu AI aplikací, které využívají LLM. Tok instrukcí poskytuje komplexní řešení, které zjednodušuje proces vytváření prototypů, experimentování, iterace a nasazování aplikací umělé inteligence.
Tok výzvy je nástroj, který můžete použít ke generování, přizpůsobení nebo spuštění průběhu.
Tok je instrukční sada, která může implementovat logiku AI. Vytvářejte nebo spouštějte toky pomocí nástrojů, jako je předem připravené plátno nebo LangChain. Iterace toku můžete uložit jako soubory. Po nasazení toku se z něj stane rozhraní API. Ne všechny toky jsou rychlé toky. Výzvový tok je jedním ze způsobů, jak vytvořit průběh.
Výzva je balíček vstupu, který se odešle do modelu. Skládá se ze vstupu uživatele, systémové zprávy a všech příkladů. Uživatelský vstup je text odeslaný v okně chatu. Systémová zpráva je sada instrukcí pro model, který definuje jeho chování a funkce.
Ukázkový tok je jednoduchý předpřipravený orchestrační tok, který ukazuje, jak toky fungují. Ukázkový tok můžete přizpůsobit.
Ukázkový dotaz je definovaná výzva pro konkrétní scénář, který můžete zkopírovat z knihovny a použít as-is nebo ho upravit v návrhu výzvy.
Vlastní jazyky kódu AI
Základním konceptem umělé inteligence je využití algoritmů k analýze dat a tvorbě modelů, které data popisují nebo hodnotí užitečnými způsoby. Vývojáři a datoví vědci a někdy i jiné algoritmy používají programovací kód k psaní algoritmů. Mezi nejoblíbenější programovací jazyky pro vývoj umělé inteligence patří Python a R.
Python je univerzální programovací jazyk vysoké úrovně. Má jednoduchou snadnou syntaxi, která zdůrazňuje čitelnost. Neexistuje žádný kompilovací krok. Python má velkou standardní knihovnu a podporuje možnost přidávat moduly a balíčky. Tato funkce podporuje modularitu a umožňuje v případě potřeby rozšířit možnosti. Existuje rozsáhlý a rostoucí ekosystém knihoven AI a strojového učení pro Python, včetně mnoha v Azure.
Další informace najdete v následujících zdrojích informací:
- Domovská stránka produktu Azure v Pythonu
- Azure pro vývojáře v Pythonu
- Machine Learning SDK pro Python
- Úvod do strojového učení pomocí Pythonu a poznámkových bloků
- Open-source knihovna strojového učení scikit-learn pro Python
- Knihovna open-source Pythonu PyTorch
- Knihovna TensorFlow pro symbolické matematické výpočty s otevřeným zdrojovým kódem
- Kurz: Použití modelů strojového učení ve službě Azure Functions pomocí Pythonu a TensorFlow
R je jazyk a prostředí pro statistické výpočty a grafiku. Můžete ho použít pro všechno, od mapování rozsáhlých sociálních a marketingových trendů online až po vývoj finančních a klimatických modelů.
Microsoft plně přijímá programovací jazyk R a poskytuje vývojářům jazyka R mnoho možností, jak spustit svůj kód v Azure.
Další informace najdete v tématu Interaktivní použití jazyka R ve službě Machine Learning.
Obecné informace o vlastní umělé inteligenci v Azure najdete v následujících zdrojích informací:
- Microsoft AI na GitHubu: Ukázky, referenční architektury a osvědčené postupy
- Machine Learning SDK pro Python
- úložiště příkladů Machine Learning
- Trénování R modelů pomocí příkazového řádku pro strojové učení v2
Případové studie
Mnoho odvětví používá AI inovativními a inspirujícími způsoby. Zvažte následující případové studie zákazníků a scénáře úspěchu:
- Volkswagen: Strojový překlad hovoří Volkswagen v 60 jazycích
- Healthcare pro všechny s Kry s využitím Azure OpenAI
- PIMCO zvyšuje klientskou službu s využitím vyhledávací platformy založené na umělé inteligenci založené na Azure AI.
- Legrand a Azure OpenAI: Poháníme chytřejší řešení s nástroji poháněnými umělou inteligencí
- C.H. Robinson překonává desetileté překážky v automatizaci logistického průmyslu pomocí Azure AI
Procházet další příběhy zákazníků AI
Obecné informace o microsoft AI
Přečtěte si další informace o umělé inteligenci Microsoftu a mějte přehled o souvisejících novinkách:
- Microsoft AI
- AI výukové centrum
- Azure AI
- Novinky o Microsoft AI
- Microsoft AI na GitHubu: Ukázky, referenční architektury a osvědčené postupy
- Centrum architektury Azure