Azure ネットワークセキュリティで保護されたコンテンツへのインデクサーアクセス

[アーティクル]
12/19/2024

概念に関するこの記事では、Azure リソースが Azure 仮想ネットワークにデプロイされている場合に、検索インデクサーがネットワークセキュリティによって保護されているコンテンツにアクセスする方法について説明します。送信トラフィックパターンとインデクサー実行環境について説明します。また、Azure AI Search でサポートされるネットワーク保護と、セキュリティ戦略に影響を与える可能性のある要因についても説明します。最後に、Azure Storage はデータアクセスと永続ストレージの両方に使用されるため、この記事では、検索とストレージの接続に固有のネットワークの考慮事項についても説明します。

代わりに詳細な手順をお探しですか? インデクサーアクセスを許可するようにファイアウォール規則を構成する方法またはプライベートエンドポイントを介して送信接続を行う方法に関する記事を参照してください。

インデクサーによってアクセスされるリソース

Azure AI 検索インデクサーは、次の 3 つの状況において、さまざまな Azure リソースへの送信呼び出しを行うことができます。

インデックス作成中に外部のデータソースに接続する場合
カスタムスキルを含むスキルセットを介して外部のカプセル化されたコードに接続する場合
スキルセットの実行中に Azure Storage に接続してエンリッチメントをキャッシュしたり、デバッグセッションの状態を保存したり、ナレッジストアに書き込んだりする場合

通常の実行でインデクサーがアクセスする可能性がある Azure リソースの種類を次の表に一覧表示します。

リソース	インデクサー実行内の目的
Azure Storage (BLOB、ADLS Gen 2、ファイル、テーブル)	データソース
Azure Storage (BLOB、テーブル)	スキルセット (エンリッチメントのキャッシュ、セッションのデバッグ、ナレッジストアのプロジェクション)
Azure Cosmos DB (さまざまな API)	データソース
Azure SQL データベース	データソース
OneLake (Microsoft Fabric)	データソース
Azure 仮想マシン上の SQL Server	データソース
SQL Managed Instance	データソース
Azure Functions	スキルセットに接続され、カスタム Web API スキルのホスティングに使用される

Note

インデクサーは、組み込みのスキルのために Azure AI サービスにも接続します。ただし、その接続は内部ネットワーク経由で行われ、制御下のネットワークプロビジョニングの対象になりません。

インデクサーは、次の方法を使用してリソースに接続します。

パブリックエンドポイントと資格情報
Azure Private Link を使用したプライベートエンドポイント
信頼されたサービスとしての接続
IP アドレス指定を通して接続する

Azure リソースが仮想ネットワーク上にある場合は、プライベートエンドポイントまたは IP アドレス指定を使用して、データへのインデクサー接続を許可する必要があります。

サポートされているネットワーク保護

Azure リソースは、Azure によって提供される任意の数のネットワーク分離メカニズムを使用して保護できます。リソースとリージョンに応じて Azure AI Search インデクサーは、次の表に示す制限付きで、IP ファイアウォールとプライベートエンドポイント経由で送信接続を行うことができます。

リソース	IP 制限	プライベートエンドポイント
Azure Storage のテキストベースのインデックス作成 (BLOB、ADLS Gen 2、ファイル、テーブル)	ストレージアカウントと検索サービスが異なるリージョンにある場合にのみサポートされます。	サポートされています
Azure Storage の AI エンリッチメント (キャッシュ、デバッグセッション、ナレッジストア)	ストレージアカウントと検索サービスが異なるリージョンにある場合にのみサポートされます。	サポートされています
NoSQL 用 Azure Cosmos DB	サポートされています	サポートされています
Azure Cosmos DB for MongoDB	サポートされています	サポートされていない
Azure Cosmos DB for Apache Gremlin	サポートされています	サポートされていない
Azure SQL データベース	サポートされています	サポートされています
Azure 仮想マシン上の SQL Server	サポートされています	該当なし
SQL Managed Instance	サポートされています	該当なし
Azure Functions	サポートされています	Azure Functions の特定の層に対してのみサポートされます

ネットワークアクセスとインデクサーの実行環境

Azure AI Search には、ジョブの特性に基づいて処理を最適化する "インデクサー実行環境" の概念があります。 2 つの環境があります。 IP ファイアウォールを使用して Azure リソースへのアクセスを制御している場合は、実行環境について理解しておくと、両方の環境を含む IP 範囲を設定するのに役立ちます。

指定されたインデクサーの実行に対し、Azure AI Search で、そのインデクサーを実行するための最適な環境が決定されます。インデクサーは、割り当てられているタスクの数と種類に応じて、2 つの環境のどちらかで実行されます。

実行環境	説明
プライベート	検索サービスの内部。プライベート環境で実行されているインデクサーは、コンピューティングリソースを、同じ検索サービス上の他のインデックス作成およびクエリのワークロードと共有します。インデクサーとデータの間に、共有プライベートリンクなどのプライベート接続を設定した場合、これが使用できる唯一の実行環境になり、これが自動的に使用されます。
マルチテナント	追加料金なしで Microsoft によって管理およびセキュリティ保護されます。これは、ご自分の管理下にあるどのネットワークプロビジョニングの対象にもなりません。この環境は、大量のコンピューティング処理を要する処理の負荷を軽減して、サービス固有のリソースをルーチン処理に残しておくために使います。リソースを大量に消費するインデクサージョブの例には、スキルセット、大規模なドキュメントの処理、大量のドキュメントの処理などがあります。

実行環境

説明

プライベート

検索サービスの内部。プライベート環境で実行されているインデクサーは、コンピューティングリソースを、同じ検索サービス上の他のインデックス作成およびクエリのワークロードと共有します。インデクサーとデータの間に、共有プライベートリンクなどのプライベート接続を設定した場合、これが使用できる唯一の実行環境になり、これが自動的に使用されます。

マルチテナント

追加料金なしで Microsoft によって管理およびセキュリティ保護されます。これは、ご自分の管理下にあるどのネットワークプロビジョニングの対象にもなりません。この環境は、大量のコンピューティング処理を要する処理の負荷を軽減して、サービス固有のリソースをルーチン処理に残しておくために使います。リソースを大量に消費するインデクサージョブの例には、スキルセット、大規模なドキュメントの処理、大量のドキュメントの処理などがあります。

Standard2 以降のサービスでは、常にプライベート環境を使用するようにインデクサーを構成できます。ただし、プライベート環境を使用するように検索サービスを構成した場合でも、スキルセット処理は常にマルチテナント環境で実行されます。インデクサーの構成の詳細については、「インデクサーの作成」を参照してください。

インデクサー実行の IP 範囲の設定

このセクションでは、どちらの実行環境からの要求でも許可する IP ファイアウォール構成について説明します。

Azure リソースがファイアウォールの内側に存在する場合は、インデクサー要求を発信できるすべての IP に対してインデクサー接続を許可する受信規則を設定します。これには、検索サービスで使用される IP アドレスと、マルチテナント環境で使用される IP アドレスが含まれます。

検索サービス (およびプライベート環境) の IP アドレスを取得するには、nslookup (または ping) で検索サービスの完全修飾ドメイン名 (FQDN) を使用します。パブリッククラウドの検索サービスの FQDN は、<service-name>.search.windows.net です。
インデクサーが実行される可能性のあるマルチテナント環境の IP アドレスを取得するには、AzureCognitiveSearch サービスタグを使用します。

Azure サービスタグには、リージョンごとのマルチテナント環境の公開された IP アドレス範囲が含まれています。これらの IP は、Discovery API またはダウンロード可能な JSON ファイルを使用して調べることができます。 IP 範囲はリージョン別に割り当てられるため、開始する前に検索サービスのリージョンを確認してください。

Azure SQL の IP 規則の設定

マルチテナント環境の IP 規則を設定する場合、特定の SQL データソースで IP アドレスの指定に対する単純なアプローチがサポートされます。規則内のすべての IP アドレスを列挙する代わりに、AzureCognitiveSearch サービスタグを指定するネットワークセキュリティグループ規則を作成できます。

データソースが次のいずれかである場合は、サービスタグを指定できます。

マルチテナント環境の IP 規則にサービスタグを指定した場合でも、nslookup から取得した、プライベート実行環境 (検索サービスそのものを意味する) の明示的な受信規則が必要であることに注意してください。

接続方法の選択

検索サービスは、仮想マシン上でネイティブに実行されている特定の仮想ネットワークにプロビジョニングすることはできません。一部の Azure リソースでは仮想ネットワークサービスエンドポイントが提供されますが、この機能は Azure AI 検索では提供されません。次のいずれかの方法の実装を計画してください。

アプローチ	詳細
Azure リソースへの受信接続をセキュリティで保護する	インデクサーによるデータの要求を許可する受信ファイアウォール規則を Azure リソースに構成します。ファイアウォール構成には、マルチテナント実行のサービスタグと検索サービスの IP アドレスを含める必要があります。インデクサーへのアクセスを許可するファイアウォール規則の構成に関する記事を参照してください。
Azure AI 検索と Azure リソースの間のプライベート接続	リソースへの接続のために検索サービスによって排他的に使用される共有プライベートリンクを構成します。接続は内部ネットワークを経由し、パブリックインターネットをバイパスします。リソースが完全にロックダウンされている場合 (保護された仮想ネットワークで実行されている場合、またはパブリック接続で使用できない場合)、プライベートエンドポイントが唯一の選択肢となります。プライベートエンドポイントを経由した送信接続の作成に関するページを参照してください。

アプローチ

詳細

Azure リソースへの受信接続をセキュリティで保護する

インデクサーによるデータの要求を許可する受信ファイアウォール規則を Azure リソースに構成します。ファイアウォール構成には、マルチテナント実行のサービスタグと検索サービスの IP アドレスを含める必要があります。インデクサーへのアクセスを許可するファイアウォール規則の構成に関する記事を参照してください。

Azure AI 検索と Azure リソースの間のプライベート接続

リソースへの接続のために検索サービスによって排他的に使用される共有プライベートリンクを構成します。接続は内部ネットワークを経由し、パブリックインターネットをバイパスします。リソースが完全にロックダウンされている場合 (保護された仮想ネットワークで実行されている場合、またはパブリック接続で使用できない場合)、プライベートエンドポイントが唯一の選択肢となります。プライベートエンドポイントを経由した送信接続の作成に関するページを参照してください。

プライベートエンドポイント経由の接続は、検索サービスのプライベート実行環境から開始する必要があります。

IP ファイアウォールの構成は無料です。 Azure Private Link に基づくプライベートエンドポイントは、課金に影響します。詳細については、「Azure Private Link の価格」をご覧ください。

ネットワークセキュリティを構成したら、続いてロールの割り当てによって、どのユーザーとグループにデータと操作に対する読み取りと書き込みのアクセス権があるかを指定します。

プライベートエンドポイントの使用に関する考慮事項

このセクションでは、プライベート接続オプションに絞って説明します。

共有プライベートリンクには、課金対象の検索サービスが必要です。その最小レベルは、テキストベースのインデックス作成向けの Basic、またはスキルベースのインデックス作成向けの Standard 2 (S2) のいずれかです。詳細については、プライベートエンドポイントの数に対するレベルの制限に関する記事を参照してください。

共有プライベートリンクが作成されると、それは検索サービスで常にその特定の Azure リソースへのすべてのインデクサー接続に使用されます。プライベート接続はロックされ、内部的に強制されます。パブリック接続のためにプライベート接続をバイパスすることはできません。
課金対象の Azure Private Link リソースが必要です。
サブスクリプション所有者がプライベートエンドポイント接続を承認する必要があります。
インデクサーのマルチテナント実行環境をオフにする必要があります。

これを行うには、インデクサーの executionEnvironment を "Private" に設定します。この手順により、すべてのインデクサー実行が、検索サービス内でプロビジョニングされたプライベート環境に限定されます。この設定のスコープは、検索サービスではなくインデクサーです。すべてのインデクサーをプライベートエンドポイント経由で接続する場合は、それぞれに次の構成が必要です。
```
    {
      "name" : "myindexer",
      ... other indexer properties
      "parameters" : {
          ... other parameters
          "configuration" : {
            ... other configuration properties
            "executionEnvironment": "Private"
          }
        }
    }
```

リソースに対して承認されたプライベートエンドポイントができると、private に設定されているインデクサーは、Azure リソース用に作成および承認されたプライベートリンクを介してアクセスを取得しようとします。

Azure AI 検索で、プライベートエンドポイントの呼び出し元に適切なロールの割り当てがなされていることが検証されます。たとえば、読み取り専用のアクセス許可があるストレージアカウントへのプライベートエンドポイント接続を要求した場合、この呼び出しは拒否されます。

プライベートエンドポイントが承認されていない場合、またはインデクサーがプライベートエンドポイント接続を使用していない場合は、インデクサーの実行履歴に transientFailure エラーメッセージが表示されます。

トークン認証を使用してネットワークセキュリティを補完する

ファイアウォールとネットワークセキュリティは、データと操作への未承認のアクセスを防ぐための最初の手順です。次の手順となるのが承認です。

ロールベースのアクセスをお勧めします。この場合、Microsoft Entra ID のユーザーとグループは、サービスへの読み取りと書き込みのアクセス権を決定するロールに割り当てられます。組み込みロールの説明とカスタムロールを作成する手順については、ロールベースのアクセス制御を使用した Azure AI 検索への接続に関するページを参照してください。

キーベースの認証が必要ない場合は、API キーを無効にし、ロールの割り当てのみを使用することをお勧めします。

ネットワークで保護されたストレージアカウントへのアクセス

検索サービスでは、インデックスとシノニムリストを格納します。ストレージを必要とするその他の機能の場合、Azure AI Search は Azure Storage に依存します。エンリッチメントキャッシュ、デバッグセッション、ナレッジストアは、このカテゴリに分類されます。各サービスの場所と、ストレージ用のネットワーク保護によって、データアクセス戦略が決まります。

同じリージョンのサービス

Azure Storage では、ファイアウォール経由でアクセスするには、要求が別のリージョンから送信されている必要があります。 Azure Storage と Azure AI Search が同じリージョンにある場合は、検索サービスのシステム ID の下にあるデータにアクセスして、ストレージアカウントの IP 制限を回避できます。

システム ID を使用してデータアクセスをサポートするには、次の 2 つのオプションがあります。

Azure Storage で信頼済みサービスとして実行し、信頼済みサービスの例外を使用するように検索を構成します。
Azure リソースからの受信要求を許可するリソースインスタンスルールを Azure Storage で構成します。

上記のオプションは認証用の Microsoft Entra ID によって異なります。つまり、Microsoft Entra ログインで接続する必要があります。現在、ファイアウォール経由の同じリージョン接続では、Azure AI Search システム割り当てマネージド ID のみがサポートされています。

異なるリージョンのサービス

検索とストレージが異なるリージョンにある場合は、前述のオプションを使用するか、お使いのサービスからの要求を許可する IP ルールを設定できます。ワークロードによっては、次のセクションで説明するように、複数の実行環境のルールを設定する必要がある場合があります。

次のステップ

Azure 仮想ネットワークにデプロイされたソリューションのインデクサーデータアクセスオプションについて理解したら、次の手順として次のハウツー記事のいずれかを確認します。

次の方法で共有

Azure ネットワークセキュリティで保護されたコンテンツへのインデクサーアクセス

インデクサーによってアクセスされるリソース

サポートされているネットワーク保護

ネットワークアクセスとインデクサーの実行環境

インデクサー実行の IP 範囲の設定

Azure SQL の IP 規則の設定

接続方法の選択

プライベートエンドポイントの使用に関する考慮事項

トークン認証を使用してネットワークセキュリティを補完する

ネットワークで保護されたストレージアカウントへのアクセス

同じリージョンのサービス

異なるリージョンのサービス

次のステップ

フィードバック

その他のリソース

次の方法で共有

Azure ネットワーク セキュリティで保護されたコンテンツへのインデクサー アクセス

インデクサーによってアクセスされるリソース

サポートされているネットワーク保護

ネットワーク アクセスとインデクサーの実行環境

インデクサー実行の IP 範囲の設定

Azure SQL の IP 規則の設定

接続方法の選択

プライベート エンドポイントの使用に関する考慮事項

トークン認証を使用してネットワーク セキュリティを補完する

ネットワークで保護されたストレージ アカウントへのアクセス

同じリージョンのサービス

異なるリージョンのサービス

次のステップ

フィードバック

その他のリソース

Azure ネットワークセキュリティで保護されたコンテンツへのインデクサーアクセス

ネットワークアクセスとインデクサーの実行環境

プライベートエンドポイントの使用に関する考慮事項

トークン認証を使用してネットワークセキュリティを補完する

ネットワークで保護されたストレージアカウントへのアクセス