Funkce služby Azure AI Search
Azure AI Search poskytuje načítání informací a využívá volitelnou integraci AI k extrakci větší hodnoty z textového a vektorového obsahu.
Následující tabulka shrnuje funkce podle kategorií. Další informace o porovnání služby Azure AI Search s jinými technologiemi vyhledávání najdete v tématu Porovnání možností hledání.
Ve všech veřejných, privátních a suverénníchcloudch Další informace najdete v tématu Volba oblasti.
Poznámka:
Hledáte funkce ve verzi Preview? Podívejte se na seznam funkcí ve verzi Preview.
Funkce indexování
Kategorie | Funkce |
---|---|
Zdroje dat | Indexy vyhledávání můžou přijímat text z libovolného zdroje za předpokladu, že je odeslán jako dokument JSON. Indexery jsou funkce, která automatizuje import dat z podporovaných zdrojů dat a extrahuje prohledávatelný obsah v primárních úložištích dat. Indexery zpracovávají serializaci JSON za vás a většina podporuje nějakou formu detekce změn a odstranění. Můžete se připojit k nejrůznějším zdrojům dat, mezi které patří OneLake, Azure SQL Database, Azure Cosmos DB nebo Azure Blob Storage. |
Hierarchické a vnořené datové struktury | Komplexní typy a kolekce umožňují modelovat prakticky jakýkoli typ struktury JSON v indexu vyhledávání. Kardinalitu 1:N a M:N lze nativně vyjádřit prostřednictvím kolekcí, komplexních typů a kolekcí komplexních typů. |
Lingvistická analýza | Analyzátory jsou komponenty, které slouží ke zpracování textu během operací indexování a vyhledávání. Ve výchozím nastavení můžete použít analyzátor Lucene pro obecné účely nebo přepsat výchozí pomocí analyzátoru jazyka, vlastního analyzátoru, který nakonfigurujete, nebo jiného předdefinovaného analyzátoru, který vytváří tokeny ve formátu, který požadujete. Jazykové analyzátory od Lucene nebo Microsoftu se používají k inteligentnímu zpracování jazykově specifických jazykových jazyků, včetně slovesných časů, pohlaví, nepravidelných podstatných jmen v množném čísle (například "mouse" vs. "mice"), slov dekompounding, dělení slov (pro jazyky bez mezer) a dalších. Vlastní lexikální analyzátory se používají pro komplexní formuláře dotazů, jako jsou fonetické porovnávání a regulární výrazy. |
Vektorové a hybridní vyhledávání
Kategorie | Funkce |
---|---|
Indexování vektorů | V indexu vyhledávání přidejte vektorová pole pro podporu scénářů vektorového vyhledávání. Vektorová pole můžou existovat společně s nevectorovými poli ve stejném hledaném dokumentu. |
Vektorové dotazy | Formulujte jednoúčelové a více vektorových dotazů. |
Vektorové vyhledávací algoritmy | Pomocí hierarchického navigace Small World (HNSW) nebo úplným k-nejbližším sousedům (KNN) můžete najít podobné vektory v indexu vyhledávání. |
Vektorové filtry | Použijte filtry před nebo po spuštění dotazu pro větší přesnost během načítání informací. |
Načtení hybridních informací | Vyhledejte koncepty a klíčová slova v jednom požadavku hybridního dotazu. Hybridní vyhledávání konsoliduje vektorové a textové vyhledávání s volitelným sémantickým řazením a laděním relevance pro nejlepší výsledky. |
Integrované blokování a vektorizace dat | Nativní bloky dat prostřednictvím dovednosti Rozdělení textu Nativní vektorizace prostřednictvím vektorizátorů a vložených dovedností, jako jsou AzureOpenAIEmbeddingModel, Azure AI Vision multimodal a dovednosti AML, které můžete použít pro připojení ke koncovým bodům v katalogu modelů Azure AI Studio. Integrovaná vektorizace poskytuje komplexní indexovací kanál ze zdrojových souborů do dotazů. |
Komprese a kvantování integrovaných vektorů | Pomocí integrované skalární a binární kvantování zmenšete velikost vektorového indexu v paměti a na disku. Můžete také předepisovat ukládání vektorů, které nepotřebujete, nebo přiřazovat úzké datové typy k vektorovým polím kvůli nižším požadavkům na úložiště. |
Použití AI a dolování znalostí
Kategorie | Funkce |
---|---|
Zpracování AI během indexování | Obohacení AI odkazuje na vložené zpracování obrázků a přirozeného jazyka v kanálu indexeru, který extrahuje text a informace z obsahu, který se jinak nedá indexovat pro fulltextové vyhledávání. Zpracování umělé inteligence se dosahuje přidáním a kombinováním dovedností v sadě dovedností, která se pak připojí k indexeru. AI může být buď předdefinovaná, od Microsoftu, jako je překlad textu nebo optické rozpoznávání znaků (OCR), nebo vlastní dovednosti , které poskytujete. |
Ukládání rozšířeného obsahu pro analýzu a spotřebu ve scénářích bez vyhledávání | Úložiště znalostí je trvalé úložiště rozšířeného obsahu určeného pro scénáře bez vyhledávání, jako je dolování znalostí a zpracování datových věd. Úložiště znalostí je definováno v sadě dovedností, ale ve službě Azure Storage se vytváří jako objekty nebo tabulkové sady řádků. |
Rozšíření uložená v mezipaměti | Ukládání do mezipaměti do mezipaměti (Preview) odkazuje na obohacení v mezipaměti, které je možné znovu použít během provádění sady dovedností. Ukládání do mezipaměti je zvláště cenné v sadách dovedností, které zahrnují analýzu OCR a obrázků, což je nákladné zpracovat. |
Fulltext a další formuláře dotazů
Kategorie | Funkce |
---|---|
Hledání v textu volného tvaru | Fulltextové vyhledávání je primární případ použití většiny vyhledávacích aplikací. Dotazy se dají formulovat pomocí podporované syntaxe. Jednoduchá syntaxe dotazů poskytuje logické operátory, operátory pro hledání slovních spojení, operátory pro přípony a operátory priority. Úplná syntaxe dotazů Lucene zahrnuje všechny operace v jednoduché syntaxi s rozšířeními pro vyhledávání přibližných shod, vyhledávání bezkontaktní komunikace, zvýšení termínu a regulární výrazy. |
Relevance | Jednoduché bodování je klíčovou výhodou služby Azure AI Search. Profily vyhodnocování (bodovací profily) se používají k modelování relevance jako funkce hodnot v samotných dokumentech. Můžete například chtít, aby se novější produkty nebo produkty se slevou zobrazovaly ve výsledcích hledání na vyšších pozicích. Můžete také vytvořit profily vyhodnocování pomocí značek pro individuální vyhodnocování podle preferencí vyhledávání zákazníků, které sledujete a ukládáte odděleně. Sémantický ranker je funkce Premium, která přeřazuje výsledky na základě sémantické relevance dotazu. V závislosti na vašem obsahu a scénáři může výrazně zlepšit relevanci vyhledávání s téměř minimální konfigurací nebo úsilím. |
Geoprostorové vyhledávání | Geoprostorové funkce filtrují a odpovídají zeměpisným souřadnicům. Můžete se shodovat s vzdáleností nebo zahrnutím do mnohoúhelníku. |
Filtry a omezující vlastnosti | Fasetová navigace se aktivuje jedním parametrem dotazu. Azure AI Search vrátí fasetovou navigační strukturu, kterou můžete použít jako kód za seznamem kategorií pro vlastní filtrování (například k filtrování položek katalogu podle cenového rozsahu nebo značky). Filtry se dají použít k začlenění fasetové navigace do uživatelského rozhraní aplikace, rozšíření možností formulování dotazu a filtrování na základě kritérií zadaných uživatelem nebo vývojářem. Filtry se vytvářejí pomocí syntaxe OData. |
Uživatelské prostředí | Automatické dokončování je možné povolit pro dotazy s předstihem na panelu hledání. Návrhy hledání fungují také s částečnými textovými vstupy na panelu hledání, ale výsledky jsou skutečné dokumenty ve vašem indexu, a ne termíny dotazu. Synonyma přidružují ekvivalentní termíny, které implicitně rozšiřují rozsah dotazu, aniž by uživatel musel zadávat alternativní termíny. Zvýrazňování nalezených položek použije formátování textu na odpovídající klíčové slovo ve výsledcích hledání. Můžete si zvolit pole, která budou vracet zvýrazněné fragmenty. Řazení se poskytuje pro několik polí prostřednictvím schématu indexu. Zapíná se pak v době dotazu jedním parametrem vyhledávání. Stránkování a omezování výsledků hledání je jednoduché pomocí jemně vyladěného ovládacího prvku, který Azure AI Search nabízí nad výsledky hledání. |
Funkce zabezpečení
Kategorie | Funkce |
---|---|
Šifrování dat | Šifrování neaktivních uložených uložených dat spravované microsoftem je integrované do interní vrstvy úložiště a je neodvolatelné. Šifrovací klíče spravované zákazníkem, které vytvoříte a spravujete ve službě Azure Key Vault, můžete použít k dodatečnému šifrování indexů a map synonym. Pro služby vytvořené po 1. srpnu 2020 se šifrování CMK rozšiřuje na data na dočasných discích pro úplné dvojité šifrování indexovaného obsahu. |
Ochrana koncových bodů | Pravidla PROTOKOLU IP pro podporu příchozí brány firewall umožňují nastavit rozsahy IP adres, ve kterých bude vyhledávací služba přijímat požadavky. Vytvoření privátního koncového bodu pomocí služby Azure Private Link k vynucení všech požadavků prostřednictvím virtuální sítě |
Příchozí přístup | Řízení přístupu na základě role přiřazuje role uživatelům a skupinám v MICROSOFT Entra ID pro řízený přístup k obsahu a operacím vyhledávání. Ověřování na základě klíčů můžete použít také v případě, že nechcete používat přiřazení rolí. |
Odchozí zabezpečení (indexery) | Přístup k datům prostřednictvím privátních koncových bodů umožňuje indexeru připojit se k prostředkům Azure, které jsou chráněné prostřednictvím služby Azure Private Link. Přístup k datům pomocí důvěryhodné identity znamená, že připojovací řetězec externím zdrojům dat může vynechat uživatelská jména a hesla. Když se indexer připojí ke zdroji dat, prostředek umožňuje připojení, pokud byla vyhledávací služba dříve zaregistrována jako důvěryhodná služba. |
Funkce portálu
Kategorie | Funkce |
---|---|
Nástroje pro vytváření prototypů a kontrolu | Přidání indexu je návrhář indexu na portálu, který můžete použít k vytvoření základního schématu sestávajícího z přiřazených polí a několika dalších nastavení. Po uložení indexu ho můžete naplnit pomocí sady SDK nebo rozhraní REST API k poskytnutí dat. Průvodce importem dat vytvoří indexy, indexery, sady dovedností a definice zdrojů dat. Pokud vaše data existují v Azure, může vám tento průvodce ušetřit významný čas a úsilí, zejména při testování konceptu a zkoumání. Import a vektorizace dat vytvoří úplný indexovací kanál, který zahrnuje bloky dat a vektorizaci. Průvodce vytvoří všechny objekty a nastavení konfigurace. Průzkumník služby Search se používá k testování dotazů a upřesňování profilů bodování. Vytvoření ukázkové aplikace slouží k vygenerování stránky HTML, která se dá použít k otestování vyhledávacího prostředí. Ladicí relace je vizuální editor, který umožňuje interaktivně ladit sadu dovedností. Zobrazuje závislosti, výstup a transformace. |
Monitorování a diagnostika | Povolte funkce monitorování, aby nepřesáhly přehled metriky, které jsou vždy viditelné na portálu. Metriky týkající se dotazů za sekundu, latence a omezování se zaznamenávají a hlásí na stránkách portálu bez nutnosti další konfigurace. |
Programovatelnost
Kategorie | Funkce |
---|---|
REST | Rozhraní REST API služby je určené pro operace roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik. Rozhraní REST API pro správu je určené k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity. |
Sada Azure SDK pro .NET | Azure.Search.Documents slouží k operacím roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik. Microsoft.Azure.Management.Search slouží k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity. |
Azure SDK pro Javu | com.azure.search.documents slouží k operacím roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik. com.microsoft.azure.management.search slouží k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity. |
Azure SDK pro Python | Dokumenty azure-search jsou určené pro operace roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik. Azure-mgmt-search slouží k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity. |
Azure SDK pro JavaScript nebo TypeScript | Azure/search-documents slouží k operacím roviny dat, včetně všech operací souvisejících s indexováním, dotazy a rozšiřováním AI. Tuto klientskou knihovnu můžete také použít k načtení systémových informací a statistik. Azure/arm-search slouží k vytváření a zřizování služeb prostřednictvím Azure Resource Manageru. Toto rozhraní API můžete také použít ke správě klíčů a kapacity. |