Sdílet prostřednictvím


Služby AI v Prostředcích infrastruktury (Preview)

Důležité

Tato funkce je ve verzi Preview.

služby Azure AI pomáhají vývojářům a organizacím rychle vytvářet inteligentní, špičkové a zodpovědné aplikace s předem připravenými a přizpůsobitelnými rozhraními API a modely. Dříve pojmenované služby Azure Cognitive Services, služby Azure AI umožňují vývojářům i v případě, že nemají přímé dovednosti nebo znalosti umělé inteligence nebo datové vědy. Cílem služeb Azure AI je pomoct vývojářům vytvářet aplikace, které můžou vidět, slyšet, mluvit, rozumět a dokonce začít zdůvodnit.

Fabric poskytuje dvě možnosti využití služeb Azure AI.

  • předem sestavené modely AI ve Fabric (Preview)

    Prostředky infrastruktury se bezproblémově integrují se službami Azure AI a umožňují rozšířit vaše data o předem připravené modely AI bez jakýchkoli předpokladů. Tuto možnost doporučujeme, protože k přístupu ke službám AI můžete použít ověřování Fabric a veškeré používání je účtováno na kapacitu Fabric. Tato možnost je aktuálně ve verzi Public Preview s dostupnými omezenými službami AI.

    Fabric nabízí Azure OpenAI Service, Analýza textu, a Azure AI Translator ve výchozím nastavení s podporou SynapseML i rozhraní RESTful API. K přístupu ke službě Azure OpenAI v Fabric můžete použít také knihovnu OpenAI Python Library . Další informace o dostupných modelech najdete v předem připravených AI modelů v systému Fabric.

  • Přineste si vlastní klíč (BYOK)

    Služby AI můžete zřídit v Azure a použít je z platformy Fabric pomocí vlastního klíče. Pokud předem vytvořené modely AI ještě nepodporují požadované služby AI, můžete dál používat BYOK (Přineste si vlastní klíč).

    Další informace o používání služeb Azure AI s BYOK najdete v tématu Služby Azure AI ve službě SynapseML s použitím vlastního klíče.

Předem připravené modely AI v Prostředcích infrastruktury (Preview)

Poznámka:

Předem připravené modely AI jsou aktuálně dostupné ve verzi Preview a nabízejí se zdarma s omezením počtu souběžných požadavků na uživatele. U modelů Open AI platí limit 20 požadavků za minutu na uživatele.

Služba Azure OpenAI

REST API, Python SDK. SynapseML

  • GPT-35-turbo: Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3. Možnost 5 Turbo, která je optimalizovaná pro chat, funguje dobře i pro tradiční úkoly dokončení. Model gpt-35-turbo-0125 podporuje až 16 385 vstupních tokenů a 4 096 výstupních tokenů.
  • Podporuje se řada gpt-4: gpt-4-32k
  • text-embedding-ada-002 (verze 2), vkládaný model, který lze použít se vkládáním požadavků rozhraní API. Maximální přijatý token požadavku je 8 191 a vrácený vektor má rozměry 1 536.

Analýza textu

REST API, SynapseML

  • Rozpoznávání jazyka: rozpozná jazyk vstupního textu.
  • Analýza mínění: Vrátí skóre mezi 0 a 1, které označuje mínění ve vstupním textu.
  • Extrakce klíčových frází: identifikuje klíčové body mluvení ve vstupním textu.
  • Rozpoznávání entit identifikovatelných osobních údajů: identifikace, kategorizace a redakce citlivých informací ve vstupním textu
  • Rozpoznávání pojmenovaných entit: Identifikuje známé entity a obecné pojmenované entity ve vstupním textu.
  • Propojení entit: identifikuje a rozlišuje identity entit nalezených v textu

Azure AI Translator

REST API, SynapseML

  • Překlad: Překládá text.
  • Transliterace: Převede text v jednom jazyce z jednoho písma do jiného písma.

Dostupné oblasti

Dostupné oblasti pro službu Azure OpenAI

Seznam oblastí Azure, kde jsou nyní k dispozici předem připravené služby AI ve službě Fabric, najdete v části Dostupné oblasti článku Přehled Copilot ve Fabric a Power BI (Preview).

Dostupné oblasti pro Analýza textu a Azure AI Translator

Předem připravená služba Text Analytics a Azure AI Translator ve Fabricu jsou nyní dostupné ve verzi Public Preview v oblastech Azure uvedených v tomto článku. Pokud v tomto článku nenajdete domovskou oblast Microsoft Fabric, můžete v podporované oblasti vytvořit kapacitu Microsoft Fabric. Další informace najdete v tématu Zakoupení předplatného Microsoft Fabric. Chcete-li zjistit svou domovskou oblast Fabric, navštivte Najít domovskou oblast Fabric.

Asie a Tichomoří Evropě Amerika Střední východ a Afrika
Austrálie – východ Severní Evropa Brazílie – jih Jižní Afrika – sever
Austrálie – jihovýchod Západní Evropa Střední Kanada Spojené arabské emiráty – sever
Středoindická Francie – střed Kanada – východ
Východní Asie Norsko – východ USA – východ
Japonsko – východ Švýcarsko – sever USA – východ 2
Jižní Korea – střed Švýcarsko – západ Severní střed USA
Southeast Asia Spojené království – jih Středojižní USA
Indie – jih Velká Británie – západ USA – západ
Západní USA 2
USA – západ 3

Míra spotřeby

Poznámka:

S účinností od 1. listopadu 2024 se fakturace předem vytvořených služeb AI ve Fabric zahájila jako součást vaší stávající kapacity Power BI Premium nebo Fabric.

Požadavek na předem vytvořené služby AI spotřebovává jednotky kapacity Fabric. Tato tabulka definuje, kolik jednotek kapacity (CU) se spotřebuje při použití služby AI.

Míra spotřeby pro jazykové modely OpenAI

modely Kontext Vstup (na 1 000 tokenů) výstup (na 1 000 tokenů)
Globální nasazení GPT-4o-2024-08-06 128 K 84,03 CU sekund 336.13 sekundy CU
GPT-4 32 K 2 016,81 CU sekund 4 033,61 CU sekund
GPT-3.5-Turbo-0125 16K 16,81 CU sekund 50,42 CU sekund

Míra spotřeby pro modely vkládání OpenAI

Modely Jednotka měření operace míra spotřeby
text-embedding-ada-002 1 000 tokenů 3,36 CU sekund

Míra spotřeby analýzy textu

operace Provozní měrná jednotka míra spotřeby
Rozpoznávání jazyka 1 000 textových záznamů 33 613,45 CU sekund
Analýza mínění 1 000 textových záznamů 33 613,45 CU sekund
Extrakce klíčových frází 1 000 textových záznamů 33 613,45 CU sekund
Rozpoznávání entit osobně identifikovatelných informací 1 000 textových záznamů 33 613,45 CU sekund
Rozpoznávání pojmenovaných entit 1 000 textových záznamů 33 613,45 CU sekund
Propojení entit 1 000 textových záznamů 33 613,45 CU sekund
Sumarizace 1 000 textových záznamů 67 226,89 CU sekund

Spotřeba služby Text Translator

operace Provozní měrná jednotka míra spotřeby
Překládat 1M znaky 336 134,45 CU sekund
Transliterovat 1M znaky 336 134,45 CU sekund

Změny služeb AI v sazbě spotřeby Fabricu

Sazby spotřeby se můžou kdykoli změnit. Microsoft používá přiměřené úsilí k poskytování oznámení prostřednictvím e-mailu nebo prostřednictvím oznámení o produktu. Změny musí být platné k datu uvedené v poznámkách k verzi společnosti Microsoft nebo na blogu Microsoft Fabric. Pokud nějaká změna služby AI v rámci sazby spotřeby látky výrazně zvýší počet kapacitních jednotek (CU) potřebných k použití, zákazníci mohou použít možnosti zrušení, které jsou dostupné pro zvolený způsob platby.

Monitorování využití

Měřič úloh přidružený k úloze určuje poplatky za předem připravené služby AI v prostředcích Fabric. Pokud je například využití služby AI odvozeno z úlohy Sparku, seskupí se a fakturuje se podle fakturačního měřiče Sparku v aplikaci Fabric Capacity Metrics.

Příklad

Vlastník online obchodu používá SynapseML a Spark ke kategorizaci milionů produktů do relevantních kategorií. Vlastník obchodu v současné době používá pevně zakódovanou logiku pro vyčištění a mapování nezpracovaného typu produktu na kategorie. Vlastník ale plánuje přejít na použití nových nativních koncových bodů Fabric OpenAI LLM (Large Language Model). Tato iterativní operace zpracuje data proti LLM pro každý řádek a následně kategorizuje produkty na základě jejich "názvu produktu", "popisu", "technických podrobností" atd.

Očekávané náklady na využití Sparku jsou 1000 jednotek CU. Očekávané náklady na využití OpenAI jsou přibližně 300 jednotek CU.

Pokud chcete novou logiku otestovat, nejprve ji iterujte v interaktivním spuštění poznámkového bloku Sparku. Jako název operace spuštění použijte „Interaktivní spuštění poznámkového bloku“. Vlastník očekává, že se v části „Interaktivní spuštění poznámkového bloku“ zobrazí celkové využití 1300 CUs s fakturačním měřičem Sparku, který bude účtovat celé využití.

Jakmile vlastník obchodu ověří logiku, vlastník nastaví pravidelné spuštění a očekává, že pod názvem operace "Naplánovaný běh úlohy Spark" uvidí celkové využití 1300 CUs, přičemž za celé využití bude odpovědný měřič fakturace Sparku.