Sdílet prostřednictvím


Co je Azure AI Search?

Azure AI Search (dříve označované jako Azure Cognitive Search) je systém načítání informací připravený pro váš heterogenní obsah, který ingestujete do vyhledávacího indexu, a nabízí uživatelům dotazy a aplikace. Dodává se s komplexní sadou pokročilých vyhledávacích technologií, která je vytvořená pro vysoce výkonné aplikace v libovolném měřítku.

Azure AI Search je doporučený systém načítání pro vytváření aplikací založených na rag v Azure s nativními integracemi LLM mezi službou Azure OpenAI a Azure Machine Learning, mechanismem integrace pro ne nativní modely a procesy a několika strategiemi pro ladění relevance.

Azure AI Search je možné použít ve scénářích tradičního vyhledávání i ve scénářích hledání GenAI. Mezi běžné případy použití patří vyhledávání v katalogu nebo dokumentu, zjišťování informací (zkoumání dat) a načítání rozšířené generace (RAG) pro konverzační vyhledávání.

Při vytváření vyhledávací služby pracujete s následujícími možnostmi:

Vyhledávací služba se nachází mezi externími úložišti dat, která obsahují neindexovaná data, a klientskou aplikací, která odesílá požadavky na dotazy do indexu vyhledávání a zpracovává odpověď.

Architektura služby Azure AI Search

V klientské aplikaci se prostředí vyhledávání definuje pomocí rozhraní API ze služby Azure AI Search a může zahrnovat ladění relevance, sémantické řazení, automatické dokončování, porovnávání synonym, přibližné shody, porovnávání vzorů, filtrování a řazení.

Azure AI Search se může na platformě Azure integrovat s dalšími službami Azure ve formě indexerů , které automatizují příjem a načítání dat ze zdrojů dat Azure, a sady dovedností, které zahrnují spotřební AI ze služeb Azure AI, jako je zpracování obrázků a přirozeného jazyka, nebo vlastní AI, které vytvoříte ve službě Azure Machine Learning nebo se zabalí do azure Functions.

Uvnitř vyhledávací služby

V samotné vyhledávací službě se obě primární úlohy indexují a dotazují.

  • Indexování je proces příjmu, který načte obsah do vyhledávací služby a umožňuje ho prohledávat. Interně se příchozí text zpracovává na tokeny a ukládá se v invertovaných indexech a příchozí vektory se ukládají do vektorových indexů. Formát dokumentu, který může Azure AI Search indexovat, je JSON. Můžete nahrát dokumenty JSON, které jste vytvořili, nebo pomocí indexeru načíst a serializovat data do FORMÁTU JSON.

    Použití umělé inteligence prostřednictvím sady dovedností rozšiřuje indexování pomocí imagí a jazykových modelů. Pokud máte obrázky nebo velký nestrukturovaný text ve zdrojovém dokumentu, můžete připojit dovednosti, které provádějí OCR, analyzují a popisují obrázky, odvozují strukturu, překládají text a další. Výstup je text, který lze serializovat do FORMÁTU JSON a ingestovat do indexu vyhledávání.

    Sady dovedností mohou během indexování také provádět bloky dat a vektorizaci. Dovednosti, které se připojují k Azure OpenAI, katalogu modelů na portálu Azure AI Foundry nebo vlastní dovednosti, které se připojují k libovolnému externímu bloku dat a vkládání, se dají použít při indexování k vytváření vektorových dat. Výstup je blokovaný vektorový obsah, který je možné ingestovat do indexu vyhledávání.

  • Dotazování může nastat, jakmile se index naplní prohledávatelným obsahem, když klientská aplikace odesílá žádosti o dotazy do vyhledávací služby a zpracovává odpovědi. Provádění všech dotazů probíhá přes index vyhledávání, který řídíte.

    Sémantické řazení je rozšíření provádění dotazů. Přidává sekundární hodnocení, pomocí jazykových porozuměním k opětovnému hodnocení sady výsledků a zvýšení úrovně nejvíce sémanticky relevantních výsledků na nejvyšší úroveň.

    Integrovaná vektorizace je také rozšířením provádění dotazů. Pokud máte v indexu vyhledávání vektorová pole, můžete odesílat nezpracované vektorové dotazy nebo text, který je vektorizovaný v době dotazu.

Azure AI Search je vhodný pro následující scénáře aplikací:

  • Použijte ho pro tradiční fulltextové vyhledávání a vyhledávání vektorů nové generace. Back your generative AI apps with information retrieval that leverages the strengths of keyword and similarity search. K načtení nejrelevavantnějších výsledků použijte oba způsoby.

  • Sloučení heterogenního obsahu do uživatelem definovaného a naplněného vyhledávacího indexu složeného z vektorů a textu. Udržujete vlastnictví a kontrolu nad tím, co je možné prohledávat.

  • Integrujte bloky dat a vektorizaci pro aplikace generující AI a RAG.

  • Použití podrobného řízení přístupu na úrovni dokumentu

  • Snižování zátěže indexování a dotazování úloh do vyhrazené vyhledávací služby.

  • Snadno implementujte funkce související s vyhledáváním: ladění relevance, fasetová navigace, filtry (včetně geografického vyhledávání), mapování synonym a automatické dokončování.

  • Transformujte velké nefferentiated textové nebo obrázkové soubory nebo soubory aplikací uložené ve službě Azure Blob Storage nebo Azure Cosmos DB na prohledávatelné bloky dat. Toho se dosahuje během indexování prostřednictvím dovedností AI, které přidávají externí zpracování z Azure AI.

  • Přidání lingvistické nebo vlastní analýzy textu Pokud máte neanglické obsah, Azure AI Search podporuje analyzátory Lucene i procesory přirozeného jazyka Microsoftu. Analyzátory můžete také nakonfigurovat tak, aby se dosáhlo specializovaného zpracování nezpracovaného obsahu, jako je odfiltrování diakritických znamének nebo rozpoznávání a zachování vzorů v řetězcích.

Další informace o konkrétních funkcích najdete v tématu Funkce služby Azure AI Search.

Jak začít

Funkce se zveřejňují prostřednictvím webu Azure Portal, jednoduchých rozhraní REST API nebo sad Azure SDK, jako je Sada Azure SDK pro .NET. Azure Portal podporuje správu služeb a správu obsahu s nástroji pro vytváření prototypů a dotazování indexů a sad dovedností.

Použití portálu Azure Portal

Komplexní zkoumání základních funkcí vyhledávání je možné provést ve čtyřech krocích:

  1. Rozhodněte se o úrovni a oblasti. Jedna bezplatná vyhledávací služba je povolená pro každé předplatné. Všechny rychlé starty je možné dokončit na úrovni Free. Pro větší kapacitu a možnosti budete potřebovat fakturovatelnou úroveň.

  2. Na webu Azure Portal vytvořte vyhledávací službu .

  3. Začněte průvodce importem dat. Zvolte předdefinovaný nebo podporovaný zdroj dat, který v minutách vytvoří, načte a dotazuje index.

  4. Dokončete Průzkumníka služby Search pomocí klienta portálu k dotazování indexu vyhledávání, který jste právě vytvořili.

Použití rozhraní API

Případně můžete vytvořit, načíst a dotazovat index vyhledávání v atomických krocích:

  1. Vytvořte index vyhledávání pomocí webu Azure Portal, rozhraní REST API, sady .NET SDK nebo jiné sady SDK. Schéma indexu definuje strukturu prohledávatelného obsahu.

  2. Nahrání obsahu pomocí modelu push k nasdílení dokumentů JSON z libovolného zdroje nebo použití modelu pull (indexerů), pokud jsou zdrojová data podporovaného typu.

  3. Dotazování indexu pomocí Průzkumníka služby Search na webu Azure Portal, rozhraní REST API, .NET SDK nebo jiné sadě SDK.

Použití akcelerátorů

Nebo zkuste akcelerátory řešení:

  • Chat s akcelerátorem datových řešení vám pomůže vytvořit vlastní řešení RAG nad obsahem.

  • Akcelerátor řešení pro konverzační dolování znalostí vám pomůže vytvořit interaktivní řešení pro extrakci přehledů z přepisů post-contact center.

  • Akcelerátor dolování znalostí dokumentů pomáhá zpracovávat a extrahovat souhrny, entity a metadata z nestrukturovaných multimodálních dokumentů.

  • Vytvoření vlastního akcelerátoru řešení copilotu, využívá službu Azure OpenAI Service, Azure AI Search a Microsoft Fabric k vytváření vlastních řešení copilotu.

    • Obecný copilot vám pomůže vytvořit vlastní kopírku, který identifikuje relevantní dokumenty, shrnuje nestrukturované informace a generuje šablony wordových dokumentů pomocí vlastních dat.

    • Client Advisor all-in-one custom copilot umožňuje Client Advisoru využívat výkon generující umělé inteligence napříč strukturovanými i nestrukturovanými daty. Pomozte našim zákazníkům optimalizovat každodenní úkoly a podporovat lepší interakce s více klienty

    • Research Assistant pomáhá vytvářet vlastního pomocníka s AI, který identifikuje relevantní dokumenty, shrnuje a kategorizuje obrovské množství nestrukturovaných informací a urychlí celkovou kontrolu dokumentů a generování obsahu.

Tip

Pokud získáte pomoc se složitými nebo vlastními řešeními, obraťte se na partnera s hlubokými znalostmi technologie Azure AI Search.

Porovnání možností hledání

Zákazníci se často ptají, jak azure AI Search porovnává s jinými řešeními souvisejícími s vyhledáváním. Následující tabulka shrnuje klíčové rozdíly.

Porovnaná alternativa Klíčové rozdíly
Microsoft Search Microsoft Search je určený pro ověřené uživatele Microsoftu 365, kteří potřebují dotazovat obsah na SharePointu. Azure AI Search načítá obsah napříč Azure a libovolnou datovou sadou JSON.
Bing Rozhraní API Bingu dotazují indexy na Bing.com shodnými termíny . Azure AI Search prohledává indexy naplněné vaším obsahem. Řídíte příjem dat a schéma.
Databázové hledání Azure SQL má fulltextové vyhledávání a vektorové vyhledávání. Azure Cosmos DB má také vyhledávání textu a vektorové vyhledávání. Azure AI Search se stává atraktivní alternativou, pokud potřebujete funkce, jako je ladění relevance nebo obsah z heterogenních zdrojů. Využívání prostředků je další důležitý bod. Indexování a dotazy jsou výpočetně náročné. Přesměrování načítání vyhledávání z DBMS zachovává systémové prostředky pro zpracování transakcí.
Vyhrazené řešení pro vyhledávání Za předpokladu, že jste se rozhodli pro vyhrazené vyhledávání s funkcí celého spektra, je konečné kategorické porovnání mezi technologiemi vyhledávání. Mezi poskytovateli cloudu je Azure AI Search nejsilnější pro vektorové, klíčové a hybridní úlohy nad obsahem v Azure pro aplikace, které se spoléhají především na hledání informací načítaných i navigace v obsahu.

Mezi hlavní silné stránky patří:

  • Podpora vektoru a nevectoru (text) indexování a dotazů Při hledání vektorové podobnosti můžete najít informace, které jsou sémanticky podobné vyhledávacím dotazům, i když hledané termíny nejsou přesné shody. Pomocí hybridního vyhledávání můžete kombinovat silné stránky klíčového slova a vektorového vyhledávání.
  • Ladění řazení a relevance prostřednictvím sémantických profilů řazení a bodování Můžete také využít syntaxi dotazu, která podporuje zvýšení priorit termínů a stanovení priorit polí.
  • Integrace dat Azure (prohledávací moduly) ve vrstvě indexování
  • Integrace Azure AI pro transformace, které umožňují prohledávat text obsahu a vektorové vyhledávání.
  • Zabezpečení Microsoft Entra pro důvěryhodná připojení a Azure Private Link pro privátní připojení ve scénářích bez internetu.
  • Full search experience: Lingvistická a vlastní analýza textu v 56 jazycích. Fasetování, automatické dokončování dotazů a navrhovaných výsledků a synonym.
  • Škálování, spolehlivost a globální dosah Azure