Features von Azure AI Search
Azure KI-Suche bietet Informationsabruf und verwendet eine optionale KI-Integration, um mehr Wert aus Text- und Vektorinhalten zu extrahieren.
In der folgenden Tabelle sind die Features nach Kategorie zusammengefasst. Weitere Informationen zum Vergleich von Azure AI Search mit anderen Suchtechnologien finden Sie unter Vergleichen von Suchoptionen.
In allen öffentlichen, privaten und souveränen Clouds von Azure gibt es Featureparität, aber einige Features werden in bestimmten Regionen nicht unterstützt. Weitere Informationen finden Sie unter Auswahl einer Region.
Hinweis
Sie suchen nach Previewfunktionen? Sehen Sie sich die Liste der Vorschaufeatures an.
Indizierungsfeatures
Kategorie | Features |
---|---|
Datenquellen | Search-Indizes können Daten aus beliebigen Quellen akzeptieren, sofern sie als JSON-Dokument übermittelt werden. Indexer sind ein Feature, das den Datenimport aus unterstützten Datenquellen automatisiert, um durchsuchbaren Inhalt in primären Datenspeichern zu extrahieren. Indexer übernehmen die JSON-Serialisierung für Sie, und die meisten unterstützen bestimmte Formen der Änderungs- und Löschungserkennung. Sie können eine Verbindung mit einer Vielzahl von Datenquellen herstellen, einschließlich OneLake, Azure SQL-Datenbank, Azure Cosmos DB oder Azure Blob Storage. |
Hierarchische und geschachtelte Datenstrukturen | Mit komplexen Typen und Sammlungen können Sie praktisch jede Art von JSON-Struktur in einem Suchindex modellieren. Die Eins-zu-viele- und Viele-zu-viele-Kardinalität kann über Sammlungen, komplexe Typen und Sammlungen von komplexen Typen nativ ausgedrückt werden. |
Linguistische Analyse | Analysemodule sind Komponenten, die für die Textverarbeitung während Indizierungs- und Suchvorgängen eingesetzt werden. Standardmäßig können Sie das universelle Lucene-Standardanalysetool verwenden oder den Standard mit einem Sprachanalysetool, einem benutzerdefinierten und von Ihnen konfigurierten Analysetool oder einem anderen vordefinierten Analysetool überschreiben, das Tokens im gewünschten Format generiert. Sprachanalysen von Lucene oder Microsoft werden verwendet, um sprachspezifische linguistische Probleme intelligent lösen zu können, z.B. Zeiten von Verben, Geschlecht, unregelmäßiger Plural von Substantiven (z.B. in Englisch: mouse/mice), Auflösen von zusammengesetzten Wörtern, Worttrennung (für Sprachen ohne Leerstellen) und vieles mehr. Benutzerdefinierte lexikalische Analysetools werden für komplexe Abfrageformulare wie phonetische Abgleichungen und reguläre Ausdrücke verwendet. |
Vektor- und Hybridsuche
Kategorie | Features |
---|---|
Vektorindizierung | Fügen Sie in einem Suchindex Vektorfelder hinzu, um Vektorsuchszenarien zu unterstützen. Vektorfelder können zusammen mit Nichtvektorfeldern im gleichen Suchdokument vorhanden sein. |
Vektorabfragen | Formulieren sie einzelne und mehrere Vektorabfragen. |
Vektorsuchalgorithmen | Verwenden Sie hierarchische Navigable Small World (HNSW) oder erschöpfende K-Nearest-Neighbors (KNN), um ähnliche Vektoren in einem Suchindex zu finden. |
Vektorfilter | Anwenden von Filtern vor oder nach der Abfrageausführung für eine höhere Genauigkeit beim Abrufen von Informationen. |
Abrufen von Hybridinformationen | Suchen Sie in einer einzigen Hybridabfrageanforderungnach Konzepten und Schlüsselwörtern. Die Hybridsuche konsolidiert die Vektor- und Textsuche mit optionaler semantischer Rangfolge und Relevanzoptimierung, um optimale Ergebnisse zu erzielen. |
Integrierte Datensegmentierung und -vektorisierung | Systemeigene Datenabschnitte durch Textteilungsfertigkeit. Native Vektorisierung durch Vektorisierer und Einbetten von Fähigkeiten wie AzureOpenAIEmbeddingModel, multimodaler Azure AI Vision und die AML-Fähigkeit, die Sie zum Herstellen einer Verbindung mit Endpunkten im Azure KI Studio-Modellkatalog verwenden können. Integrierte Vektorisierung stellt eine End-to-End-Indizierungspipeline von Quelldateien zu Abfragen bereit. |
Integrierte Vektorkomprimierung und Quantisierung | Verwenden Sie die integrierte Skalar- und Binärquantisierung, um die Vektorindexgröße im Arbeitsspeicher und auf dem Datenträger zu reduzieren. Sie können auch auf die Speicherung von Vektoren, die Sie nicht benötigen, verzichten oder kleine Datentypen Vektorfeldern für geringere Speicheranforderungen zuweisen. |
Angewandte KI und Knowledge Mining
Kategorie | Features |
---|---|
KI-Verarbeitung während der Indizierung | Die KI-Anreicherung bezieht sich auf die eingebettete Verarbeitung von Bildern und natürlicher Sprache in einer Indexer-Pipeline, die Text und Informationen aus Inhalten extrahiert, die sonst nicht für die Volltextsuche indiziert werden können. Die KI-Verarbeitung wird durch das Hinzufügen und Kombinieren von Fähigkeiten in einem Skillset erreicht, das dann an einen Indexer angeschlossen wird. Bei der KI kann es sich entweder um integrierte Fähigkeiten von Microsoft handeln, wie z. B. Textübersetzung oder optische Zeichenerkennung (OCR), oder um angepasste Fähigkeiten, die Sie bereitstellen. |
Speichern von angereicherten Inhalten für die Analyse und Nutzung in Szenarien ohne Suche | Ein Wissensspeicher ist eine dauerhafte Speicherung von angereicherten Inhalten, die für Nicht-Such-Szenarien wie Knowledge-Mining und Data-Science-Verarbeitung gedacht ist. Ein Wissensspeicher wird in einem Skillset definiert, aber in Azure Storage als Objekte oder tabellarische Rowsets erstellt. |
Angereicherte Inhalte im Cache | Anreicherungszwischenspeicherung (Preview) bezieht sich auf zwischengespeicherte Anreicherungen, die während der Skillsetausführung wiederverwendet werden können. Die Zwischenspeicherung ist besonders wertvoll bei Skillsets, die OCR und Bildanalyse beinhalten, die teuer in der Verarbeitung sind. |
Volltext und andere Abfrageformulare
Kategorie | Features |
---|---|
Freiform-Textsuche | Volltextsuche ist für die meisten Apps auf Suchbasis ein primärer Anwendungsfall. Abfragen können mit einer unterstützten Syntax formuliert werden. Die einfache Abfragesyntax bietet die logischen Operatoren, Operatoren für die Suche von Ausdrücken, Suffixoperatoren und Rangfolgenoperatoren. Die vollständige Lucene-Abfragesyntax enthält alle Vorgänge in einfacher Syntax mit Erweiterungen für Fuzzysuche, NEAR-Suche, Term Boosting und reguläre Ausdrücke. |
Relevance | Einfache Bewertung ist ein zentraler Vorteil von Azure AI Search. Anhand von Bewertungsprofilen kann die Relevanz als Funktion der Werte in den Dokumenten selbst modelliert werden. Beispielsweise kann es wünschenswert sein, dass neuere Produkte oder herabgesetzte Produkte in den Suchergebnissen weiter oben angezeigt werden. Sie können Bewertungsprofile auch mithilfe von Tags für eine personalisierte Bewertung erstellen, die auf den Sucheinstellungen der Kunden basiert, die Sie nachverfolgt und separat gespeichert haben. Beim Semantischen Sortierer handelt es sich um ein Premiumfeature, das die Ergebnisse auf der Grundlage der semantischen Relevanz der Abfrage neu ordnet. Je nach Inhalt und Szenario kann die Suchrelevanz mit nahezu minimalem Konfigurationsaufwand erheblich verbessert werden. |
Geosuche | Geofunktionen filtern nach geografischen Koordinaten und stimmen mit ihnen überein. Sie können eine Übereinstimmung nach Entfernung oder durch Einschließen in eine Polygonform finden. |
Filter und Facets | Die Facettennavigation wird über einen einzigen Abfrageparameter aktiviert. Azure AI Search gibt eine Struktur für die Facettennavigation zurück, die Sie als Code hinter einer Kategorieliste für eine selbstgesteuerte Filterung nutzen können (z.B. um Katalogartikel nach Preisbereich oder Marke zu filtern). Filter ermöglichen die Integration einer Facettennavigation in die Benutzeroberfläche Ihrer Anwendung, die Erweiterung von Abfrageformulierungen sowie die Filterung auf der Grundlage von Kriterien von Benutzern oder Entwicklern. Erstellen Sie Filter mithilfe der OData-Syntax. |
Benutzererfahrung | AutoVervollständigen kann für Abfragen mit Textvervollständigung auf einer Suchleiste aktiviert werden. Suchvorschläge funktioniert auch mit Eingaben von Textteilen in eine Suchleiste, jedoch werden die Ergebnisse als tatsächliche Dokumente in Ihrem Index dargestellt und nicht als Abfragebegriffe. Synonyme ordnen entsprechende Begriffe zu, die den Bereich einer Abfrage implizit erweitern, ohne dass der Benutzer die alternativen Begriffe bereitstellen muss. Mit der Treffermarkierung wird eine Textformatierung auf ein übereinstimmendes Schlüsselwort in den Suchergebnissen angewendet. Sie können auswählen, für welche Felder hervorgehobene Ausschnitte zurückgegeben werden sollen. Sortierung wird über das Indexschema für mehrere Felder bereitgestellt und dann zur Abfragezeit mit einem einzelnen Suchparameter umgeschaltet. Paginierung und Drosselung Ihrer Suchergebnisse ist einfach mit dem fein abgestimmten Steuerelement, das Azure AI Search über Ihre Suchergebnisse bietet. |
Sicherheitsfeatures
Kategorie | Features |
---|---|
Datenverschlüsselung | Die von Microsoft verwaltete Verschlüsselung ruhender Daten ist in der internen Speicherebene integriert und unwiderruflich. Kundenseitig verwaltete Verschlüsselungsschlüssel, die Sie in Azure Key Vault erstellen und verwalten, können zur ergänzenden Verschlüsselung von Indizes und Synonymzuordnungen verwendet werden. Bei Diensten, die nach dem 1. August 2020 erstellt wurden, erstreckt sich die CMK-Verschlüsselung auch auf Daten auf temporären Datenträgern, um eine vollständige doppelte Verschlüsselung der indexierten Inhalte zu erreichen. |
Endpoint Protection | IP-Regeln für eingehende Firewallunterstützung ermöglichen Ihnen das Einrichten von IP-Adressbereichen, über die der Suchdienst Anforderungen akzeptiert. Sie können mithilfe von Azure Private Link einen privaten Endpunkt erstellen, um alle Anforderungen über ein virtuelles Netzwerk zu erzwingen. |
Eingehender Zugriff | Die rollenbasierte Zugriffssteuerung weist Benutzern und Gruppen in der Microsoft Entra-ID Rollen zu, um den kontrollierten Zugriff auf Suchinhalte und -vorgänge zu ermöglichen. Sie können auch eine schlüsselbasierte Authentifizierung verwenden, wenn Sie keine Rollenzuweisungen nutzen möchten. |
Ausgangssicherheit (Indexer) | Der Datenzugriff über private Endpunkte ermöglicht einem Indexer das Herstellen einer Verbindung mit Azure-Ressourcen, die über Azure Private Link geschützt werden. Datenzugriff mithilfe einer vertrauenswürdigen Identität bedeutet, dass die Verbindungszeichenfolgen zu externen Datenquellen Benutzernamen und Kennwörter weglassen können. Wenn ein Indexer eine Verbindung mit der Datenquelle herstellt, lässt die Ressource die Verbindung zu, wenn der Suchdienst zuvor als vertrauenswürdiger Dienst registriert wurde. |
Portalfunktionen
Kategorie | Features |
---|---|
Tools für Prototyperstellung und Überprüfung | Index hinzufügen ist ein Index-Designer im Portal, mit dem Sie ein grundlegendes Schema erstellen können, das aus attributierten Feldern und einigen anderen Einstellungen besteht. Nachdem Sie den Index gespeichert haben, können Sie ihn mithilfe eines SDK oder der REST-API auffüllen, um die Daten bereitzustellen. Der Datenimport-Assistent erstellt Indizes, Indexer, Skillsets und Datenquellendefinitionen. Wenn Ihre Daten in Azure vorhanden sind, können Sie mit diesem Assistenten beträchtliche Zeit und Mühe sparen, insbesondere beim Untersuchen von Proof-of-Concepts-Szenarios. Importieren und Vektorisieren von Daten erstellt eine vollständige Indizierungspipeline, die Datenblöcke und Vektorisierung umfasst. Der Assistent erstellt alle Objekte und Konfigurationseinstellungen. Der Such-Explorer wird zum Testen von Abfragen und Verfeinern von Bewertungsprofilen verwendet. Das Erstellen einer Demo-App wird verwendet, um eine HTML-Seite zu generieren, die zum Testen der Suchfunktion verwendet werden kann. Bei Debugsitzungen handelt es sich um einen visuellen Editor, mit dem Sie ein Skillset interaktiv debuggen können. Er zeigt Abhängigkeiten, Ausgabe und Transformationen an. |
Überwachung und Diagnose | Durch Aktivieren der Überwachungsfunktionen können neben den Metriken, die im Portal immer angezeigt werden, zusätzliche Metriken verwendet werden. Metriken zu Abfragen pro Sekunde, Latenz und Drosselung werden erfasst und in Portalseiten protokolliert, ohne dass hierzu eine zusätzliche Konfiguration erforderlich ist. |
Programmierbarkeit
Kategorie | Features |
---|---|
REST | Die Dienste-REST-API ist für Datenebenenvorgänge einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden. Management-REST-API dient der Diensterstellung und -bereitstellung über Azure Resource Manager. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |
Azure SDK für .NET | Azure.Search.Documents ist für Datenebenenvorgänge einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden. Microsoft.Azure.Management.Search dient der Diensterstellung und -bereitstellung über Azure Resource Manager. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |
Azure SDK für Java | com.azure.search.documents ist für Datenebenenvorgänge einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden. com.microsoft.azure.manament.search dient der Diensterstellung und -bereitstellung über Azure Resource Manager. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |
Azure SDK für Python | azure-search-documents ist für Datenebenenvorgänge einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden. azure-mgmt-search dient der Diensterstellung und -bereitstellung über Azure Resource Manager. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |
Azure SDK für JavaScript bzw. TypeScript | azure/search-documents ist für Datenebenenvorgänge einschließlich aller Vorgänge im Zusammenhang mit der Indizierung, Abfragen und der KI-Anreicherung konzipiert. Sie können diese Clientbibliothek auch zum Abrufen von Systeminformationen und Statistiken verwenden. azure/arm-seach dient der Diensterstellung und -bereitstellung über Azure Resource Manager. Sie können diese API auch verwenden, um Schlüssel und Kapazität zu verwalten. |