Služby AI v Prostředcích infrastruktury (Preview)
Důležité
Tato funkce je ve verzi Preview.
služby Azure AI pomáhají vývojářům a organizacím rychle vytvářet inteligentní, špičkové a zodpovědné aplikace s předem připravenými a přizpůsobitelnými rozhraními API a modely. Dříve pojmenované služby Azure Cognitive Services, služby Azure AI umožňují vývojářům i v případě, že nemají přímé dovednosti nebo znalosti umělé inteligence nebo datové vědy. Cílem služeb Azure AI je pomoct vývojářům vytvářet aplikace, které můžou vidět, slyšet, mluvit, rozumět a dokonce začít zdůvodnit.
Fabric poskytuje dvě možnosti využití služeb Azure AI.
předem sestavené modely AI ve Fabric (Preview)
Prostředky infrastruktury se bezproblémově integrují se službami Azure AI a umožňují rozšířit vaše data o předem připravené modely AI bez jakýchkoli předpokladů. Tuto možnost doporučujeme, protože k přístupu ke službám AI můžete použít ověřování Fabric a veškeré používání je účtováno na kapacitu Fabric. Tato možnost je aktuálně ve verzi Public Preview s dostupnými omezenými službami AI.
Fabric nabízí Azure OpenAI Service, Analýza textu, a Azure AI Translator ve výchozím nastavení s podporou SynapseML i rozhraní RESTful API. K přístupu ke službě Azure OpenAI v Fabric můžete použít také knihovnu OpenAI Python Library . Další informace o dostupných modelech najdete v předem připravených AI modelů v systému Fabric.
Přineste si vlastní klíč (BYOK)
Služby AI můžete zřídit v Azure a použít je z platformy Fabric pomocí vlastního klíče. Pokud předem vytvořené modely AI ještě nepodporují požadované služby AI, můžete dál používat BYOK (Přineste si vlastní klíč).
Další informace o používání služeb Azure AI s BYOK najdete v tématu Služby Azure AI ve službě SynapseML s použitím vlastního klíče.
Předem připravené modely AI v Prostředcích infrastruktury (Preview)
Poznámka:
Předem připravené modely AI jsou aktuálně dostupné ve verzi Preview a nabízejí se zdarma s omezením počtu souběžných požadavků na uživatele. U modelů Open AI platí limit 20 požadavků za minutu na uživatele.
Služba Azure OpenAI
REST API, Python SDK. SynapseML
- GPT-35-turbo: Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3. Možnost
5 Turbo
, která je optimalizovaná pro chat, funguje dobře i pro tradiční úkoly dokončení. Modelgpt-35-turbo-0125
podporuje až 16 385 vstupních tokenů a 4 096 výstupních tokenů. - Podporuje se řada gpt-4:
gpt-4-32k
- text-embedding-ada-002 (verze 2), vkládaný model, který lze použít se vkládáním požadavků rozhraní API. Maximální přijatý token požadavku je 8 191 a vrácený vektor má rozměry 1 536.
Analýza textu
- Rozpoznávání jazyka: rozpozná jazyk vstupního textu.
- Analýza mínění: Vrátí skóre mezi 0 a 1, které označuje mínění ve vstupním textu.
- Extrakce klíčových frází: identifikuje klíčové body mluvení ve vstupním textu.
- Rozpoznávání entit identifikovatelných osobních údajů: identifikace, kategorizace a redakce citlivých informací ve vstupním textu
- Rozpoznávání pojmenovaných entit: Identifikuje známé entity a obecné pojmenované entity ve vstupním textu.
- Propojení entit: identifikuje a rozlišuje identity entit nalezených v textu
Azure AI Translator
- Překlad: Překládá text.
- Transliterace: Převede text v jednom jazyce z jednoho písma do jiného písma.
Dostupné oblasti
Dostupné oblasti pro službu Azure OpenAI
Seznam oblastí Azure, kde jsou nyní k dispozici předem připravené služby AI ve službě Fabric, najdete v části Dostupné oblasti článku Přehled Copilot ve Fabric a Power BI (Preview).
Dostupné oblasti pro Analýza textu a Azure AI Translator
Předem připravená služba Text Analytics a Azure AI Translator ve Fabricu jsou nyní dostupné ve verzi Public Preview v oblastech Azure uvedených v tomto článku. Pokud v tomto článku nenajdete domovskou oblast Microsoft Fabric, můžete v podporované oblasti vytvořit kapacitu Microsoft Fabric. Další informace najdete v tématu Zakoupení předplatného Microsoft Fabric. Chcete-li zjistit svou domovskou oblast Fabric, navštivte Najít domovskou oblast Fabric.
Asie a Tichomoří | Evropě | Amerika | Střední východ a Afrika |
---|---|---|---|
Austrálie – východ | Severní Evropa | Brazílie – jih | Jižní Afrika – sever |
Austrálie – jihovýchod | Západní Evropa | Střední Kanada | Spojené arabské emiráty – sever |
Středoindická | Francie – střed | Kanada – východ | |
Východní Asie | Norsko – východ | USA – východ | |
Japonsko – východ | Švýcarsko – sever | USA – východ 2 | |
Jižní Korea – střed | Švýcarsko – západ | Severní střed USA | |
Southeast Asia | Spojené království – jih | Středojižní USA | |
Indie – jih | Velká Británie – západ | USA – západ | |
Západní USA 2 | |||
USA – západ 3 |
Míra spotřeby
Poznámka:
S účinností od 1. listopadu 2024 se fakturace předem vytvořených služeb AI ve Fabric zahájila jako součást vaší stávající kapacity Power BI Premium nebo Fabric.
Požadavek na předem vytvořené služby AI spotřebovává jednotky kapacity Fabric. Tato tabulka definuje, kolik jednotek kapacity (CU) se spotřebuje při použití služby AI.
Míra spotřeby pro jazykové modely OpenAI
modely | Kontext | Vstup (na 1 000 tokenů) | výstup (na 1 000 tokenů) |
---|---|---|---|
Globální nasazení GPT-4o-2024-08-06 | 128 K | 84,03 CU sekund | 336.13 sekundy CU |
GPT-4 | 32 K | 2 016,81 CU sekund | 4 033,61 CU sekund |
GPT-3.5-Turbo-0125 | 16K | 16,81 CU sekund | 50,42 CU sekund |
Míra spotřeby pro modely vkládání OpenAI
Modely | Jednotka měření operace | míra spotřeby |
---|---|---|
text-embedding-ada-002 | 1 000 tokenů | 3,36 CU sekund |
Míra spotřeby analýzy textu
operace | Provozní měrná jednotka | míra spotřeby |
---|---|---|
Rozpoznávání jazyka | 1 000 textových záznamů | 33 613,45 CU sekund |
Analýza mínění | 1 000 textových záznamů | 33 613,45 CU sekund |
Extrakce klíčových frází | 1 000 textových záznamů | 33 613,45 CU sekund |
Rozpoznávání entit osobně identifikovatelných informací | 1 000 textových záznamů | 33 613,45 CU sekund |
Rozpoznávání pojmenovaných entit | 1 000 textových záznamů | 33 613,45 CU sekund |
Propojení entit | 1 000 textových záznamů | 33 613,45 CU sekund |
Sumarizace | 1 000 textových záznamů | 67 226,89 CU sekund |
Spotřeba služby Text Translator
operace | Provozní měrná jednotka | míra spotřeby |
---|---|---|
Překládat | 1M znaky | 336 134,45 CU sekund |
Transliterovat | 1M znaky | 336 134,45 CU sekund |
Změny služeb AI v sazbě spotřeby Fabricu
Sazby spotřeby se můžou kdykoli změnit. Microsoft používá přiměřené úsilí k poskytování oznámení prostřednictvím e-mailu nebo prostřednictvím oznámení o produktu. Změny musí být platné k datu uvedené v poznámkách k verzi společnosti Microsoft nebo na blogu Microsoft Fabric. Pokud nějaká změna služby AI v rámci sazby spotřeby látky výrazně zvýší počet kapacitních jednotek (CU) potřebných k použití, zákazníci mohou použít možnosti zrušení, které jsou dostupné pro zvolený způsob platby.
Monitorování využití
Měřič úloh přidružený k úloze určuje poplatky za předem připravené služby AI v prostředcích Fabric. Pokud je například využití služby AI odvozeno z úlohy Sparku, seskupí se a fakturuje se podle fakturačního měřiče Sparku v aplikaci Fabric Capacity Metrics.
Příklad
Vlastník online obchodu používá SynapseML a Spark ke kategorizaci milionů produktů do relevantních kategorií. Vlastník obchodu v současné době používá pevně zakódovanou logiku pro vyčištění a mapování nezpracovaného typu produktu na kategorie. Vlastník ale plánuje přejít na použití nových nativních koncových bodů Fabric OpenAI LLM (Large Language Model). Tato iterativní operace zpracuje data proti LLM pro každý řádek a následně kategorizuje produkty na základě jejich "názvu produktu", "popisu", "technických podrobností" atd.
Očekávané náklady na využití Sparku jsou 1000 jednotek CU. Očekávané náklady na využití OpenAI jsou přibližně 300 jednotek CU.
Pokud chcete novou logiku otestovat, nejprve ji iterujte v interaktivním spuštění poznámkového bloku Sparku. Jako název operace spuštění použijte „Interaktivní spuštění poznámkového bloku“. Vlastník očekává, že se v části „Interaktivní spuštění poznámkového bloku“ zobrazí celkové využití 1300 CUs s fakturačním měřičem Sparku, který bude účtovat celé využití.
Jakmile vlastník obchodu ověří logiku, vlastník nastaví pravidelné spuštění a očekává, že pod názvem operace "Naplánovaný běh úlohy Spark" uvidí celkové využití 1300 CUs, přičemž za celé využití bude odpovědný měřič fakturace Sparku.