Sdílet prostřednictvím


Úložiště funkcí pracovního prostoru (starší verze)

Poznámka:

Tato dokumentace zahrnuje Workspace Feature Store. Úložiště Feature Store je k dispozici pouze pro pracovní prostory vytvořené před 19. srpnem 2024, 16:00 (UTC).

Databricks doporučuje používat funkci přípravy funkcí v katalogu Unity. Úložiště funkcí pracovního prostoru bude v budoucnu zrušeno.

Proč používat úložiště funkcí pracovního prostoru?

Úložiště funkcí pracovního prostoru je plně integrované s dalšími komponentami Azure Databricks.

  • Zjistitelnost. Uživatelské rozhraní úložiště funkcí přístupné z pracovního prostoru Databricks umožňuje procházet a vyhledávat existující funkce.
  • Rodokmen. Když v Azure Databricks vytvoříte tabulku funkcí, uloží se a zpřístupní zdroje dat použité k vytvoření tabulky funkcí. Pro každou funkci v tabulce funkcí máte také přístup k modelům, poznámkovým blokům, úlohám a koncovým bodům, které tuto funkci používají.
  • Integrace s bodováním a obsluhou modelu Když k trénování modelu použijete funkce z úložiště funkcí, model se zabalí s metadaty funkcí. Když použijete model pro dávkové vyhodnocování nebo online odvozování, automaticky načte funkce z úložiště funkcí. Volající o nich nemusí vědět ani nezahrnovat logiku, aby vyhledal nebo připojil funkce pro určení skóre nových dat. Díky tomu je nasazení modelu a aktualizace mnohem jednodušší.
  • Vyhledávání k určitému bodu v čase Úložiště funkcí podporuje případy použití podle časových řad a událostí, které vyžadují správnost k určitému bodu v čase.

Jak funguje úložiště funkcí pracovního prostoru?

Typický pracovní postup strojového učení využívající úložiště funkcí se řídí tímto způsobem:

  1. Napište kód pro převod nezpracovaných dat na funkce a vytvořte datový rámec Sparku obsahující požadované funkce.
  2. zapsat datový rámec jako tabulku prvků v úložišti prvků pracovního prostoru.
  3. Trénování modelu pomocí funkcí z úložiště funkcí Když to uděláte, uloží model specifikace funkcí používaných pro trénování. Když se model používá k odvozování, automaticky spojí funkce z příslušných tabulek funkcí.
  4. Registrace modelu v registru modelů

Model teď můžete použít k předpovědím nových dat. V případě dávkového použití model automaticky načte funkce, které potřebuje, z úložiště funkcí.

Pracovní postup úložiště funkcí pro případy použití dávkového strojového učení

Pro případy použití v reálném čase publikujte funkce do online obchodu. Podívejte se na online obchody třetích stran.

V době odvozování model čte předem vypočítané funkce z online obchodu a spojí je s daty poskytnutými v požadavku klienta na koncový bod obsluhující model.

Tok úložiště funkcí pro modely strojového učení, které se obsluhují.

Začněte používat úložiště prvků ve Workspace Feature Store

Pokud chcete začít, vyzkoušejte tyto ukázkové poznámkové bloky. Základní poznámkový blok vás provede postupem vytvoření tabulky funkcí, jeho použití k trénování modelu a následnému dávkovému vyhodnocování pomocí automatického vyhledávání funkcí. Seznámí vás také s uživatelským rozhraním pro přípravu funkcí a ukáže, jak ho můžete použít k vyhledávání funkcí a pochopení toho, jak se vytvářejí a používají funkce.

Ukázkový poznámkový blok úložiště funkcí základního pracovního prostoru

Získat poznámkový blok

Ukázkový poznámkový blok taxi znázorňuje proces vytváření funkcí, jejich aktualizace a jejich použití pro trénování modelu a dávkové odvozování.

Ukázkový poznámkový blok obchodu s funkcemi pracovního prostoru

Získat poznámkový blok

Podporované datové typy

Podporované datové typy najdete v tématu Podporované datové typy.