Azure AI Vision の新機能
Azure AI Vision の新機能について説明します。 このページを確認して、新機能、機能の強化、修正、ドキュメントの更新についての最新情報を入手してください。
2024 年 9 月
モデルのカスタマイズと製品認識の廃止
2025 年 1 月 10 日に、Azure AI Vision の製品認識とモデルのカスタマイズ機能は廃止されます。 この日以降、これらのサービスへの API 呼び出しは失敗します。
モデルの円滑な動作を維持するには、現在一般提供されている Azure AI Custom Vision に移行してください。 Custom Vision は、これらの廃止機能と同様の機能を提供しています。
2024 年 8 月
顔の新しい検出可能な属性
眼鏡、オクルージョン、ぼかし、露出の属性は、最新の検出 03 モデルで使用できます。 詳細については、「顔検出モデルを指定する」を参照してください。
2024 年 5 月
新しい Face SDK 1.0.0-beta.1 (破壊的変更)
Face SDK は、Azure SDK のガイドラインと設計原則をより適切に満たすために、バージョン 1.0.0-beta.1 で書き換えられました。 サポートされている言語は、C#、Python、Java、JavaScript です。 使用を開始するには、クイックスタートに従ってください。
2024 年 2 月
マルチモーダル埋め込み GA: 新しい多言語モデル
マルチモーダル埋め込み API が更新され、一般公開されました。 新しい 2024-02-01
API には、102 個の言語でのテキスト検索をサポートする新しいモデルが含まれています。 元の英語のみのモデルは引き続き使用できますが、同じ検索インデックス内で新しいモデルと組み合わせることはできません。 英語のみのモデルを使用してテキストと画像をベクター化した場合、これらのベクターは多言語テキストと画像のベクターと互換性がありません。
サポートされている言語の一覧については、言語サポートのページを参照してください。
2024 年 1 月
新しい Image Analysis SDK 1.0.0-beta.1 (破壊的変更)
Image Analysis SDK はバージョン 1.0.0-beta.1 で書き換えられ、他の Azure SDK との連携が強化されました。 すべての API が変更されています。 新しい SDK の使用方法については、更新されたクイックスタート、サンプル、およびハウツーガイドを参照してください。
重大な変更:
- SDK により、プレビュー Computer Vision REST API (2023-04-01-preview) ではなく、一般公開されている Computer Vision REST API (2023-10-01) が呼び出されるようになりました。
- JavaScript のサポートが追加されました。
- C++ のサポートは終了しました。
- カスタム モデルを使用した画像解析と、画像のセグメント化 (背景の削除) は、Computer Vision REST API (2023-10-01) でまだサポートされていないため、SDK でサポートされなくなりました。 いずれかの機能を使用するには、Computer Vision REST API (2023-04-01-preview) を直接呼び出します (
Analyze
操作とSegment
操作をそれぞれ使用)。
2023 年 11 月
Analyze Image 4.0 の一般提供
Analyze Image 4.0 REST API の一般提供が開始されました。 使用を開始するには、Analyze Image 4.0 のクイックスタートに従ってください。
モデルのカスタマイズ、背景の削除、マルチモーダル埋め込みなど、Image Analysis のその他の機能は、パブリック プレビューのままです。
ライブネス検出用の Faceクライアント側 SDK
Face Liveness SDK は、ユーザーのモバイルまたはエッジ デバイスでのライブネス検出をサポートします。 Java/Kotlin for Android と Swift/Objective-C for iOS で利用できます。
当社のライブネス検出サービスは、iBeta レベル 1 および 2 ISO/IEC 30107-3 コンプライアンスを満たしています。
2023 年 9 月
期限切れの Computer Vision API バージョンの廃止
Computer Vision API バージョン 1.0、2.0、3.0、3.1 は、2026 年 9 月 13 日に廃止されます。 開発者は、その日以降、これらの API に対して API 呼び出しを行うことはできません。 影響を受けるすべてのユーザーは、できる限り早くこのクイック スタートに従って、一般公開されている Computer Vision 3.2 API にワークロードを移行することをお勧めします。 また、最新かつ最も優れた画像解析機能を備えている Image Analysis 4.0 API (プレビュー) への移行も検討する必要があります。
質問については、Q&A をご覧ください。
2023 年 5 月
Image Analysis 4.0 Product Recognition (パブリック プレビュー)
Product Recognition API を使用すると、小売店の棚の写真を分析できます。 製品の有無を検出し、境界ボックス座標を取得できます。 モデルのカスタマイズと組み合わせて使用して、特定の製品を識別するモデルをトレーニングします。 Product Recognition の結果を店舗のプラノグラム ドキュメントと比較することもできます。 Product Recognition.
2023 年 4 月
Face の制限付きアクセス トークン
独立系ソフトウェア ベンダー (ISV) が、通常は限定的な Face 機能へのアクセスを許可するアクセス トークンを発行することで、クライアントの Face API の使用状況を管理する方法について説明します。 これにより、クライアント企業は正式な承認プロセスを経ることなく Face API を使用できます。 制限付きアクセス トークンを使用します。
2023 年 3 月
Azure AI Vision Image Analysis 4.0 SDK パブリック プレビュー
Florence の基盤モデルは、Azure AI Vision に統合されました。 改良された Vision サービスを利用することで、開発者は、さまざまな業界の市場に対応した責任ある Azure AI Vision アプリケーションを作成することができます。 お客様は、データをシームレスにデジタル化し、分析し、自然言語対話に接続することで、画像やビデオ コンテンツから強力な分析情報を引き出し、アクセシビリティのサポート、SEO による取得の促進、有害コンテンツからのユーザー保護、セキュリティ強化、インシデント応答時間の短縮化を実現できるようになりました。 詳細については、Microsoft の Florence の基盤モデルの発表に関するページを参照してください。
Image Analysis 4.0 SDK (パブリック プレビュー)
Image Analysis 4.0 が、C#、C++、Python の クライアント ライブラリ SDK を通じて利用できるようになりました。 この更新には、人間と同等のパフォーマンスの Florence を利用した画像キャプションと高密度キャプションも含まれます。
Image Analysis V4.0 のキャプションと高密度キャプション (パブリック プレビュー):
V4.0 では、"Describe" が "Caption" に置き換えられました。これは、詳細と意味理解が豊富な、改善された画像キャプション機能です。 高密度キャプションを使用すると、画像全体の説明に加えて、画像の最大 10 個の領域について 1 文の説明が生成され、より詳細な情報が提供されます。 高密度キャプションからは、説明の対象になっている画像領域の境界ボックスの座標も返されます。 新しい性別に依存しないパラメーターもあります。これにより、顧客は、代替テキストと Seeing AI アプリケーションで、確率的性別推論を有効にするかどうかを選択できます。 デジタル コンテンツをサポートするために、豊富なキャプション、アクセス可能な代替テキスト、SEO の最適化、インテリジェントな写真キュレーションが自動的に提供されます。 画像キャプション.
ビデオ要約とフレーム ロケーター (パブリック プレビュー):
考えたり書いたりするのと同じ直感的な方法で、ビデオ コンテンツを検索して操作します。 追加のメタデータを必要とせずに、関連するコンテンツを見つけます。 Vision Studio でのみ使用できます。
Image Analysis 4.0 のモデル カスタマイズ (パブリック プレビュー)
Vision Studio または v4.0 REST API を使用して、独自のカスタム画像分類モデルと物体検出モデルを作成してトレーニングできるようになりました。
マルチモーダル埋め込み API (パブリック プレビュー)
Image Analysis 4.0 API の一部であるマルチモーダル埋め込み API を使用すると、画像とテキストの ベクター化 クエリが可能になります。 これにより、画像とテキストを多次元ベクトル空間内の座標に変換できます。 ベクター類似検索を使用して、自然言語で検索して関連する画像を見つけることができるようになりました。
背景削除 API (パブリック プレビュー)
Image Analysis 4.0 API の一部である背景削除 API を使用すると、画像の背景を削除できます。 この操作では、背景を透明にして検出された前景オブジェクトの画像を出力すること、または検出された前景オブジェクトの不透明度を示すグレースケール アルファ マット画像を出力することができます。
Azure AI Vision 3.0 と 3.1 プレビューの廃止
Azure AI Vision 3.0 および 3.1 API のプレビュー バージョンは、2023 年 9 月 30 日に廃止される予定です。 お客様は、この日付を過ぎてこれらの API を呼び出すことはできません。 代わりに、ワークロードを一般提供 (GA) 3.2 API に移行することをお勧めします。 プレビュー バージョンから 3.2 API に移行するときは、次の変更点に注意してください。
- Analyze Image と Read API の呼び出しでは、使用する AI モデルを指定するために使用できるオプションの model-version パラメーターが使用されます。 既定では、最新のモデルが使用されます。
- Analyze Image と Read API の呼び出しでは、成功した API 応答で
model-version
フィールドも返されます。 このフィールドは、使用されたモデルを報告します。 - Azure AI Vision 3.2 API では、別のエラー報告形式が使用されます。 error-handling コードを調整する方法については、API リファレンス ドキュメントを参照してください。
2022 年 10 月
Azure AI Vision Image Analysis 4.0 (パブリック プレビュー)
Image Analysis 4.0 がパブリック プレビューでリリースされました。 新しい API には、画像のキャプション作成、画像のタグ付け、物体検出、スマート トリミング、人物検出、OCR の読み取り機能が含まれており、1 つの Analyze Image 操作ですべて使用できます。 OCR は、OCR を利用したエクスペリエンスをワークフローに簡単に埋め込むことができる、パフォーマンスが向上した同期 API 内で、ドキュメント以外の一般的な画像用に最適化されています。
2022 年 9 月
Azure AI Vision 3.0/3.1 Read プレビューの非推奨化
Azure AI Vision 3.0 および 3.1 Read API のプレビュー バージョンは、2023 年 1 月 31 日に廃止される予定です。 代わりに、一般提供 (GA) バージョンの Read API を用うには、ハウツーとクイックスタートに関する記事を参照することをお勧めします。 最新の GA バージョンには、次のベネフィットがあります。
- 2022 年の最新の一般提供 OCR モデル
- 手書きテキストのサポートを含む、OCR の対応言語の大幅な拡大
- OCR の品質の向上
2022 年 6 月
Vision Studio の提供開始
Vision Studio は、Azure AI Vision の機能を調べ、ビルドし、アプリケーションに統合できるようにする UI ツールです。
Vision Studio は、さまざまなサービス機能を試し、そこから返される結果を視覚的に確認するためのプラットフォームとなります。 Studio を使用すると、コードを記述せずに始められ、それからアプリケーションで使用可能なクライアント ライブラリと REST API を使用できるようになります。
Face での責任ある AI
顔のわかりやすさに関するメモ
- わかりやすさに関するメモでは、誤った識別やその他のエラーのケースを検出して解決するための意味のある人間によるレビューを組み込み、結果が正しくないと思っているユーザーにサポートを提供し、運用状況の変化による正確性の変動を特定して対処することで、お客様がシステムの正確性と公平性を向上できるようにするガイダンスを提供します。
機密性の高い属性の廃止
- 性別、年齢、笑顔、顔ひげ、髪、メイクなど、感情的な状態の推測や属性の特定を行おうとする顔分析機能を廃止しました。
- 顔検出機能 (ぼかし、露出、眼鏡、ヘッドポーズ、ランドマーク、ノイズ、オクルージョン、顔境界ボックスの検出を含む) は一般公開されたままであり、申請は必要ありません。
Fairlearn パッケージと Microsoft の公平性ダッシュボード
- オープンソースの Fairlearn パッケージと Microsoft の公平性ダッシュボードは、お客様が独自のデータで Microsoft の顔検証アルゴリズムの公平性を測定できるようにサポートすることを目的としています。これにより、テクノロジをデプロイする前に、さまざまな人口統計グループに影響を与える可能性のある潜在的な公平性の問題を特定して対処できます。
制限付きアクセス ポリシー
- 更新された責任ある AI 標準に Face を準拠させる一環として、Face API と Azure AI Vision 用に新しい制限付きアクセス ポリシーが実装されました。 既存のお客様が提供したユース ケースに基づいて顔認識サービスへの継続的なアクセスを申請して承認を受けるために 1 年の期間が設けられています。 Face および Azure AI Vision の制限付きアクセスの詳細については、それぞれこちらとこちらをご覧ください。
Azure AI Vision 3.2 プレビューの廃止
3.2 API のプレビュー バージョンは、2022 年 12 月に廃止される予定です。 代わりに、この API の一般提供 (GA) バージョンを使用することをお勧めします。 3.2-preview バージョンから移行するときは、次の変更点に注意してください。
- Analyze Image と Read API の呼び出しでは、使用する AI モデルを指定するために使用できるオプションのmodel-version パラメーターが使用されるようになりました。 既定では、最新のモデルが使用されます。
- Analyze Image と Read API の呼び出しでは、成功した API 応答で
model-version
フィールドも返されます。 このフィールドは、使用されたモデルを報告します。 - 画像分析の API では、別の error-reporting 形式が使用されるようになりました。 error-handling コードを調整する方法については、API リファレンス ドキュメントを参照してください。
2022 年 5 月
OCR (Read) API モデルが一般公開 (GA) になりました
Azure AI Vision の OCR (Read) API の最新モデルが 164 の言語に対応し、クラウド サービスとコンテナーとして一般公開されました。
- 印刷テキストの OCR サポートが、ロシア語、アラビア語、ヒンディー語、その他キリル文字、アラビア文字、デーバナーガリー文字を使用する言語を含む 164 の言語に拡張されます。
- 手書きテキストの OCR サポートが、英語、簡体中国語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、スペイン語の 9 の言語に拡張されます。
- 単一文字、手書きの日付、金額、名前、その他領収書や請求書でよく見られるエンティティのサポートが強化されました。
- デジタル PDF ドキュメントの処理が改善されました。
- 入力ファイルのサイズ制限が 10x から 500 MB に増加しました。
- パフォーマンスと待機時間の改善。
- クラウド サービスおよび Docker コンテナーとして使用できます。
GA モデルを使用する方法については、OCR ハウツー ガイドを参照してください。
2022 年 2 月
OCR (Read) API パブリック プレビューが 164 の言語に対応
Azure AI Vision の OCR (Read) API は、対応する言語が最新のプレビューで 164 に拡張されます。
- 印刷テキストの OCR サポートは、アラビア語やヒンディー語など、アラビア文字やデーバナーガリー文字を使用した言語を含む 42 の新しい言語に拡張されます。
- 手書きテキストに対する OCR サポートは、英語、簡体中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語に加えて、日本語と韓国語に拡張されます。
- 手書きの日付、金額、名前、単一文字ボックスのサポート向上を含む機能強化が行われています。
- 一般的なパフォーマンスと AI の品質の向上
新しいプレビュー機能を使用する方法については、OCR ハウツー ガイドを参照してください。
Detection_01 および Detection_03 の新しい品質属性
- システム ビルダーとその顧客が Face API からの高品質の出力に必要な高品質の画像をキャプチャできるように、新しい品質属性 QualityForRecognition を導入します。これは、画像が顔認識を試みるのに十分な品質であるかどうかを判断するのに役立ちます。 値は、低、中、または高の非公式評価です。 この新しい属性は、検出モデル
detection_01
またはdetection_03
と、認識モデルrecognition_03
またはrecognition_04
の任意の組み合わせを使用している場合にのみ使用できます。 個人の登録には "高" 品質の画像のみ、識別シナリオでは "中" 以上の品質をお勧めします。 新しい品質属性の詳細については、「顔検出と属性」を参照し、クイックスタートで使用方法 を参照してください。
2021 年 9 月
OCR (Read) API パブリック プレビューが 122 の言語に対応
Azure AI Vision の OCR (Read) API は、対応する言語が最新のプレビューで 122 に拡張されます。
- 49 の新しい言語 (ロシア語、ブルガリア語、その他のキリル語系やラテン語系など) での印刷テキストに対する OCR サポート。
- 6 つの新しい言語 (英語、簡体中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語など) での手書きテキストに対する OCR サポート。
- ID ドキュメント内の機械読み取り可能ゾーン (MRZ) テキストおよびデジタル PDF を処理する機能の強化。
- 一般的なパフォーマンスと AI の品質の向上
新しいプレビュー機能を使用する方法については、OCR ハウツー ガイドを参照してください。
2021 年 8 月
画像のタグ付け言語の拡張
画像のタグ付け機能の最新バージョン (v3.2) では、50 言語のタグがサポートされるようになりました。 詳細については、言語サポートに関するページを参照してください。
2021 年 7 月
Detection_03 の新しい HeadPose とランドマークの向上
- Detection_03 モデルが更新され、顔のランドマークがサポートされるようになりました。
- Detection_03 のランドマーク機能は、特に視線追跡に不可欠な眼球ランドマークでは、はるかに正確です。
2021 年 5 月
空間分析コンテナーの更新
新しい機能セットが含まれる空間分析コンテナーの新しいバージョンがリリースされています。 この Docker コンテナーを使用すると、リアルタイム ストリーミング ビデオを分析して、物理環境における人物とその動きとの間の空間的な関係を把握できます。
空間分析操作を構成して、人が向いている方向を検出できるようになりました。
- 向き分類子は、
enable_orientation
パラメーターを構成することで、personcrossingline
およびpersoncrossingpolygon
操作に対して有効にすることができます。 既定ではオフに設定されています。
- 向き分類子は、
空間分析操作では、歩いたり走ったりしている人の速度を検出する構成も提供されるようになりました
- 速度は、
enable_speed
分類子をオンにすることによって、personcrossingline
およびpersoncrossingpolygon
操作について検出できます。既定ではオフになっています。 出力は、speed
、avgSpeed
、minSpeed
の各出力に反映されます。
- 速度は、
2021 年 4 月
Azure AI Vision v3.2 GA
Azure AI Vision API v3.2 の一般提供が開始されました。次の点が更新されています。
- 改善された画像のタグ付けモデル: ビジュアル コンテンツが分析され、画像に表示されているオブジェクト、アクション、コンテンツに基づいて、関連するタグが生成されます。 このモデルは、Tag Image API を介して利用できます。 詳細については、画像分析の使用法ガイドおよび概要に関するページを参照してください。
- 更新されたコンテンツ モデレーション モデル: アダルト コンテンツの存在が検出され、成人向け、わいせつ、または不快なビジュアル コンテンツを含む画像をフィルター処理するためのフラグが提供されます。 このモデルは、Analyze API を介して利用できます。 詳細については、画像分析の使用法ガイドおよび概要に関するページを参照してください。
- 73 言語で利用可能な OCR (Read)。これには、簡易字中国語と繁体字中国語、日本語、韓国語、ラテン語系の言語が含まれます。
- OCR (Read) は、オンプレミス デプロイ用のディストリビューションレス コンテナーとしても利用できます。
PersonDirectory のデータ構造 (プレビュー)
- 類似の識別や検索といった顔認識操作を実行するために、Face API のお客様は、Person オブジェクトの類別された一覧を作成する必要があります。 新しい PersonDirectory は、ディレクトリに追加された Person の各 ID について、一意の ID、オプションの名前文字列、およびオプションのユーザー メタデータ文字列が格納されたデータ構造です。 現在、Face API には同様の機能を持つ LargePersonGroup 構造が用意されていますが、100 万の ID に制限されています。 PersonDirectory 構造は、最大 7,500 万の ID までスケールアップできます。
- PersonDirectory と以前のデータ構造のもう 1 つの大きな違いは、顔を Person オブジェクトに追加した後にトレーニングの呼び出しを行う必要がなくなったことです。更新プロセスは自動的に行われます。 詳細については、「PersonDirectory 構造を使用する」を参照してください。
2021 年 3 月
Azure AI Vision 3.2 パブリック プレビューの更新
Azure AI Vision API v3.2 パブリック プレビューが更新されました。 プレビュー リリースには、すべての Azure AI Vision 機能に加えて、更新された Read および Analyze API が含まれています。
2021 年 2 月
Read API v3.2 のパブリック プレビューが 73 言語の OCR に対応
クラウド サービスおよび Docker コンテナーとして利用できる Azure AI Vision Read API v3.2 パブリック プレビューには、こちらの更新が含まれます。
- OCR が 73 言語に対応。簡易字中国語と繁体字中国語、日本語、韓国語、ラテン語系の言語が含まれます。
- テキスト行出力に自然な読みの順序を使用 (ラテン語系の言語のみ)
- テキスト行に対する手書きスタイルの分類と信頼度スコア (ラテン語系の言語のみ)。
- 複数ページから成るドキュメントで選択ページのみのテキストを抽出。
- オンプレミス デプロイ用のディストリビューションレス コンテナーとして利用可能。
詳細については、Read API の攻略ガイドを参照してください。
新しい Face API 検出モデル
- 新しい Detection 03 モデルは、現在使用できる最も正確な検出モデルです。 新しいお客様の場合は、このモデルを使用することをお勧めします。 検出 03 では、画像内で見つかった小さい顔のリコールと精度が向上しています (64x64 ピクセル)。 その他の改善点としては、偽陽性が全体的に削減されたことと、回転した顔の向きの検出が向上したことがあります。 Detection 03 と新しい Recognition 04 モデルを組み合わせることにより、認識の精度も向上します。 詳細については、「顔検出モデルを指定する」を参照してください。
顔の新しい検出可能な属性
faceMask
属性は、最新の Detection 03 モデルで使用できます。また、フェイス マスクによって、意図されたとおりに鼻と口の両方がカバーされるように装着されているかどうかを検出する追加の"noseAndMouthCovered"
属性を使用できます。 最新のマスク検出機能を使用するには、ユーザーが API 要求で検出モデルを指定する必要があります。detectionModel パラメーターにdetection_03
を設定してモデルのバージョンを割り当てます。 詳細については、「顔検出モデルを指定する」を参照してください。
新しい Face API 認識モデル
- 新しい Recognition 04 モデルは、現在使用できる最も正確な認識モデルです。 新しいお客様の場合は、検証と識別にこのモデルを使用することをお勧めします。 これにより、Recognition 03 の精度が向上し、フェイス マスク (サージカル マスク、N95 マスク、布マスク) を装着したユーザーの認識が向上します。 フェイス カバーを装着しているユーザーの画像の登録は、認識品質が低下するためお勧めしません。 最新の Detection 03 モデルを使用して、ユーザーがフェイス カバーを装着しているかどうかを検出し、最新の Recognition 04 モデルを使用してそれらのユーザーを認識する、安全でシームレスなユーザー エクスペリエンスを構築できるようになりました。 詳細については、「顔認識モデルを指定する」を参照してください。
2021 年 1 月
空間分析コンテナーの更新
新しい機能セットが含まれる空間分析コンテナーの新しいバージョンがリリースされています。 この Docker コンテナーを使用すると、リアルタイム ストリーミング ビデオを分析して、物理環境における人物とその動きとの間の空間的な関係を把握できます。
- 人物がマスクなどの顔を保護するものを装着しているかどうかを検出するように空間分析操作を構成できるようになりました。
- マスク分類子は、
ENABLE_FACE_MASK_CLASSIFIER
パラメーターを構成することで、personcount
、personcrossingline
、およびpersoncrossingpolygon
操作に対して有効にすることができます。 - ビデオ ストリームで検出された人物それぞれの信頼度スコアと共に、
face_mask
およびface_noMask
属性がメタデータとして返されます
- マスク分類子は、
- personcrossingpolygon 操作が拡張され、人がゾーン内で費やした滞在時間を計算できるようになりました。 この操作のゾーンの構成で
type
パラメーターをzonedwelltime
に設定できます。これにより、personZoneDwellTimeEvent 型の新しいイベントに、人がゾーン内で費やした時間 (ミリ秒単位) が設定されたdurationMs
フィールドが含まれるようになります。 - 破壊的変更:personZoneEvent イベントの名前が personZoneEnterExitEvent に変更されました。 人がゾーンに出入りするときに personcrossingpolygon イベントが発生し、交差したゾーンの番号付き側に方向情報を提供します。
- ビデオの URL を、すべての操作で "Private Parameter/obfuscated" として指定できます。 難読化はオプションになり、
KEY
およびIV
が環境変数として指定されている場合にのみ機能します。 - 既定では、すべての操作で較正が有効になっています。 無効にするには、
do_calibration: false
を設定します。 enable_recalibration
パラメーターによる自動再較正 (既定では無効) のサポートを追加しました。詳細については、「空間分析操作」を参照してください- カメラ較正のパラメーターを
DETECTOR_NODE_CONFIG
にします。 詳細については、「空間分析操作」を参照してください。
待ち時間の軽減
- Face チームは、サービス使用時の待機時間の潜在的な原因と、考えられる軽減戦略について詳しく説明されている、新しい記事を公開しました。 「Face サービスを使用するときの待機時間を軽減する」を参照してください。
2020 年 12 月
Face ID ストレージのお客様の構成
- Face サービスにはお客様の画像は格納されませんが、抽出された顔の特徴がサーバーに格納されます。 Face ID は顔の特徴の識別子であり、Face - Identify、Face - Verify、Face - Find Similar で使用されます。 格納されている顔の特徴は、元の検出呼び出しから 24 時間後に有効期限が切れ、削除されます。 これらの Face ID がキャッシュされる時間の長さを、お客様が決定できるようになりました。 最大値は最大 24 時間で変わりませんが、最小値として 60 秒に設定できるようになりました。 Face ID がキャッシュされている新しい時間範囲は、60 秒から 24 時間までの任意の値です。 詳細については、Face - Detect API リファレンス (faceIdTimeToLive パラメーター) を参照してください。
2020 年 11 月
サンプルの顔登録アプリ
- チームは、サンプルの顔登録アプリを公開して、高品質の登録を通して意味のある同意を確立し、高精度の顔認識システムを作成するためのベストプラクティスを示しました。 オープンソースのサンプルを登録アプリのビルドに関するガイドと GitHub に追加しました。開発者はすぐにデプロイまたはカスタマイズすることができます。
2020 年 10 月
Azure AI Vision API v3.1 GA
一般提供中の Azure AI Vision API は、v3.1 にアップグレードされました。
2020 年 9 月
空間分析コンテナー プレビュー
空間分析コンテナーは現在プレビュー段階です。 Azure AI Vision の空間分析機能を使用すると、リアルタイム ストリーミング ビデオを分析して、物理環境における人物とその動きとの間の空間的な関係を把握できます。 空間分析は、オンプレミスで使用できる Docker コンテナーです。
Read API v3.1 パブリック プレビューが新たに日本語の OCR に対応
Azure AI Vision Read API v3.1 パブリック プレビューで、こちらの機能が追加されました。
日本語の OCR
それぞれのテキスト行について、その体裁が手書きであるか印刷スタイルであるかが信頼度スコア (ラテン語系の言語のみ) と共に示されます。
複数ページから成るドキュメントから、選択されたページまたはページ範囲のテキストのみを抽出します。
この Read API のプレビュー バージョンでは、英語、オランダ語、フランス語、ドイツ語、イタリア語、日本語、ポルトガル語、簡体字中国語、およびスペイン語がサポートされています。
詳細については、Read API の攻略ガイドを参照してください。
2020 年 8 月
保存データのカスタマー マネージド暗号化
- Face サービスでは、クラウドに永続化されるときにデータが自動的に暗号化されます。 Face サービスの暗号化によってデータは保護され、組織のセキュリティおよびコンプライアンス コミットメントを満たすのに役立ちます。 サブスクリプションでは、Microsoft が管理する暗号化キーが既定で使用されます。 カスタマー マネージド キー (CMK) と呼ばれるユーザー独自のキーを使用してサブスクリプションを管理する新しいオプションもあります。 詳細については、カスタマー マネージド キーに関するページを参照してください。
2020 年 7 月
Read API v3.1 のパブリック プレビューが簡体字中国語の OCR に対応
Azure AI Vision Read API v3.1 パブリック プレビューで、簡体字中国語のサポートが追加されました。
- この Read API のプレビュー バージョンでは、英語、オランダ語、フランス語、ドイツ語、イタリア語、ポルトガル語、簡体字中国語、およびスペイン語がサポートされています。
詳細については、Read API の攻略ガイドを参照してください。
2020 年 5 月
Azure AI Vision API v3.0 が一般提供になり、Read API が更新されています。
- 英語、オランダ語、フランス語、ドイツ語、イタリア語、ポルトガル語、およびスペイン語のサポート
- 精度の向上
- 抽出された各単語の信頼度スコア
- 新しい出力形式
詳細については、OCR の概要に関するページを参照してください。
2020 年 4 月
新しい Face API 認識モデル
- 新しい認識 03 モデルは、現在使用できる最も正確なモデルです。 新しいお客様の場合は、このモデルを使用することをお勧めします。 Recognition 03 を使うと、類似性比較と人物照合比較の両方の正確性が向上します。 詳細については、「顔認識モデルを指定する」を参照してください。
2020 年 3 月
- TLS 1.2 は現在、このサービスへのすべての HTTP 要求に適用されるようになりました。 詳しくは、Azure AI サービスのセキュリティをご覧ください。
2020 年 1 月
Read API 3.0 パブリック プレビュー
Read API のバージョン3.0 を使用すると、印刷されたテキストまたは手書きテキストを画像から抽出できます。 以前のバージョンと比較して、3.0 では以下のものが提供されます。
- 精度の向上
- 新しい出力形式
- 抽出された各単語の信頼度スコア
- 言語パラメーターでのスペイン語と英語のサポート
3\.0 API の使用を開始するには、テキストの抽出に関するクイックスタートに従ってください。
2019 年 6 月
新しい Face API 検出モデル
- 新しい Detection 02 モデルの特徴は、小さい顔、横顔、隠れた顔、ぼやけた顔における精度の向上です。 Face - Detect、FaceList - Add Face、LargeFaceList - Add Face、PersonGroup Person - Add Face、LargePersonGroup Person - Add Face で、
detectionModel
パラメーターに新しい顔検出モデル名detection_02
を指定して使用してください。 詳細については、検出モデルの指定方法に関するページを参照してください。
2019 年 4 月
属性の精度の向上
age
とheadPose
属性の全体的な精度の向上。headPose
属性も、pitch
値で更新されます。 これらの属性を、Face - DetectreturnFaceAttributes
パラメーターのreturnFaceAttributes
パラメーターに指定して使用します。
処理速度の向上
- Face - Detect、FaceList - Add Face、LargeFaceList - Add Face、PersonGroup Person - Add Face、および LargePersonGroup Person - Add Face 各操作の速度が向上しました。
2019 年 3 月
新しい Face API 認識モデル
- Recognition 02 モデルの精度が向上しています。 Face - Detect、FaceList - Create、LargeFaceList - Create、PersonGroup - Create、LargePersonGroup - Create で、
recognitionModel
パラメーターに新しい顔認識モデル名recognition_02
を指定して使用してください。 詳細については、認識モデルの指定方法に関するページを参照してください。
2019 年 1 月
Face Snapshot 機能
- Snapshot 機能により、サブスクリプション間のデータ移行がサポートされます。
重要
2023 年 6 月 30 日の時点で、Face Snapshot API は廃止されました。
2018 年 10 月
API メッセージ
- 「PersonGroup - Get Training Status (PersonGroup - トレーニングの状態の取得)」、「LargePersonGroup - Get Training Status (LargePersonGroup - トレーニングの状態の取得)」、および「LargeFaceList - Get Training Status (LargeFaceList - トレーニング状態の取得)」で、
status
、createdDateTime
、lastActionDateTime
、およびlastSuccessfulTrainingDateTime
の説明を改善しました。
2018 年 5 月
属性の精度の向上
gender
属性が大幅に改善され、age
、glasses
、facialHair
、hair
、makeup
属性も改善されました。 Face - DetectreturnFaceAttributes
パラメーターを通じてそれらを使用します。
ファイル サイズの上限の引き上げ
- Face - Detect、FaceList - Add Face、LargeFaceList - Add Face、PersonGroup Person - Add Face、LargePersonGroup Person - Add Face で入力画像ファイルのサイズ上限が 4 MB から 6 MB に増えました。
2018 年 3 月
新しいデータ構造
- (LargeFaceList と LargePersonGroup)。 詳細については、「 登録されたユーザーの数の増分に対応するためにスケーリングする方法」を参照してください。
- Face - Identify
maxNumOfCandidatesReturned
パラメーターを [1, 5] から [1, 100] に増やしました。既定値は 10 です。
2017 年 5 月
顔の新しい検出可能な属性
hair
、makeup
、accessory
、occlusion
、blur
、exposure
、noise
属性を Face - DetectreturnFaceAttributes
パラメーターに追加しました。- PersonGroup と Face - Identify で 1 万人に対応しました。
- PersonGroup Person - List がオプション パラメーターの
start
とtop
で改ページに対応しました。 - さまざまな FaceLists と PersonGroup のさまざまな人に対する顔の追加/削除でコンカレンシーに対応しました。
2017 年 3 月
顔の新しい検出可能な属性
- Face - Detect
returnFaceAttributes
パラメーターにemotion
属性を追加しました。
修正された問題
- FaceList - Add Face と PersonGroup Person - Add Face で
targetFace
として Face - Detect から返された顔を長方形で再検出することができませんでした。 - 検出可能な顔サイズは、厳密に 36 x 36 から 4096 x 4096 ピクセルになるように設定されています。
2016 年 11 月
新しいサブスクリプション レベル
- 同一人物確認や同様の照合に PersonGroup Person - Add Face または FaceList - Add Face を使用するとき、保存する顔の数を増やすために Face ストレージ Standard サブスクリプションを追加しました。 保存した画像には、顔 1000 個あたり 0.5 ドルの料金がかかります。この料金は日割りで課金されます。 Free レベルのサブスクリプションは引き続き合計 1,000 人に制限されます。
2016 年 10 月
API メッセージ
- FaceList - Add Face と PersonGroup Person - Add Face で、
targetFace
の複数の顔に対するエラー メッセージが 'There are more than one face in the image' から 'There is more than one face in the image' に変更されました。
2016 年 7 月
新機能
- Face - Verify が Face to Person のオブジェクト認証に対応しました。
mode
というオプション パラメーターが追加され、Face - Find Similar でmatchPerson
とmatchFace
という 2 つの作業モードを選択できるようになりました。指定しなければ、matchPerson
です。confidenceThreshold
というオプション パラメーターを追加しました。Face - Identify で、ある顔がある Person オブジェクトに属するかどうかを示すしきい値をこのパラメーターで設定できます。- PersonGroup - List にオプション パラメーターの
start
とtop
を追加しました。一覧表示する開始点と合計 PersonGroups 数を指定できます。
V1.0 の V0 からの変更点
- サービス ルート エンドポイントが
https://westus.api.cognitive.microsoft.com/face/v0/
からhttps://westus.api.cognitive.microsoft.com/face/v1.0/
に更新されました。 変更は Face - Detect、Face - Identify、Face - Find Similar、Face - Group に適用されます。 - 顔の検出可能な最小サイズが 36 x 36 ピクセルに変更されました。 36 x 36 ピクセルより小さな顔は検出されません。
- Face V0 では、PersonGroup データと Person データが非推奨になりました。 それらのデータには Face V1.0 サービスでアクセスできません。
- 2016 年 6 月 30 日をもって Face API の V0 エンドポイントが非推奨になりました。