Document AI Konfuzio
ドキュメント AIKonfuzio Connector to OCR を使用して、PDF、画像、手書き、およびスキャンから構造化情報を抽出および取得します。 さまざまなファイルタイプのOCRPDFおよび画像を無料で入手するには https://app.konfuzio.com で登録をして、https://dev.konfuzio.com/web/api.html#supported-file-types を参照してください。 さらに、https://help.konfuzio.com/tutorials/quickstart/ 上のチュートリアルに従ってカスタムドキュメント AI をトレーニングして、ドキュメントから構造化情報を抽出します。
このコネクタは、次の製品および地域で利用可能です。
Service | クラス | 地域 |
---|---|---|
Logic Apps | 標準 | 以下を除くすべての Logic Apps 地域 : - Azure 政府の地域 - Azure 中国の地域 - 国防総省 (DoD) |
Power Automate | プレミアム | 以下を除くすべての Power Automate 地域 : - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運用する中国のクラウド - 国防総省 (DoD) |
Power Apps | プレミアム | 以下を除くすべての Power Apps 地域 : - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運用する中国のクラウド - 米国国防総省 (DoD) |
お問い合わせ先 | |
---|---|
件名 | Helm & Nagel GmbH |
[URL] | https://help.konfuzio.com |
メール | info@konfuzio.com |
Connector Metadata | |
---|---|
発行者 | Helm & Nagel GmbH |
Web サイト | https://konfuzio.com |
プライバシー ポリシー | https://konfuzio.com/de/impressum/ |
カテゴリ | デーータ;コンテンツとファイル |
このコネクタを使用して Konfuzio に接続することにより、ドキュメント内の情報を OCR、抽出、検証、処理、および理解します。 Konfuzio をトレーニングして、ファイル ベースの情報キャリアを理解し、複雑なバック オフィス プロセスを自動化し、より多くのデータを使用してインサイトを生成します。 Konfuzio を使用すると、このコネクタを使用するビジネス ユーザーは、ドキュメントを分類して情報を抽出できます。 オプションで、データ サイエンティストは、ユーザー フレンドリーな Web インターフェイスを備えた自動テキストおよび画像ラベリング ツールとして Konfuzio を使用して、高品質のデータ セットを維持し、世界クラスの AI を構築し、AI を統合し、ループ内の人間と AI を改善できます。
前提条件
app.konfuzio.com で無料で登録してください。 無料プランでは、限られた数の機能が提供されます。 有料サービスの機能については、こちら を参照してください。 有料サービスへのアップグレードをご希望の場合は、info@konfuzio.com からお問い合わせください。
help.konfuzio.com のクイックスタート チュートリアルの説明に従ってプロジェクトをセットアップします。
資格情報の入手方法
コネクタを使用するための資格情報として、app.konfuzio.com でユーザー アカウントを作成するために使用したユーザー名とパスワードを使用します。
コネクタの使用を開始する
help.konfuzio.com で、コネクタの使用を開始するための最新のステップバイステップのプロセスを参照してください。
既知の問題と制限事項
- コネクタは約 70 の言語をサポートしています。dev.konfuzio.com を参照してください。
- コネクタはさまざまなファイルの種類をサポートします。 サポートされているファイルの種類の詳細なリストについては、dev.konfuzio.com を参照してください。
- コネクタは、数値、パーセンテージ、日付値、およびブール値を参照する文字列のデータ正規化をサポートしています。dev.konfuzio.com を参照してください
一般的なエラーと解決策
エラーが発生した場合は、support@konfuzio.com からお問い合わせください。
よくあるご質問
help.konfuzio.com で Power Automate コネクタに関するよくある質問を公開しています。
接続の作成
コネクタは、次の認証タイプをサポートしています:
既定 | 接続を作成するためのパラメーター。 | すべての地域 | 共有不可 |
既定
適用できるもの: すべての領域
接続を作成するためのパラメーター。
これは共有可能な接続ではありません。 パワー アプリが別のユーザーと共有されている場合、別のユーザーは新しい接続を明示的に作成するように求められます。
件名 | タイプ | 内容 | 必要 |
---|---|---|---|
ユーザー名 | securestring | この API のユーザー名 | 真 |
パスワード | securestring | この API のパスワード | 真 |
調整制限
名前 | 呼び出し | 更新期間 |
---|---|---|
接続ごとの API 呼び出し | 100 | 60 秒 |
アクション
ドキュメントの抽出結果にフィードバックを与える |
適合した抽出結果辞書を送信することにより、フィードバックを提供できます。 Python コードの例:
|
ドキュメントの抽出結果を取得する |
ID を使用してドキュメントのすべての情報を取得します。処理が終了すると、抽出結果を利用できます |
ドキュメントを削除します |
ドキュメントを削除します。 |
新規ドキュメントのアップロード |
新規ドキュメントのアップロード |
ドキュメントの抽出結果にフィードバックを与える
適合した抽出結果辞書を送信することにより、フィードバックを提供できます。
Python コードの例:
import requests
import json
from requests.auth import HTTPBasicAuth
url = f"https://app.konfuzio.com/api/v2/docs/{DOC_ID}/"
auth = HTTPBasicAuth(KONFUZIO_USER, KONFUZIO_PASSWORD)
data = requests.get(url=url, auth=auth).json()
# Mark Extraction as correct.
data['labels']['Bruttozahlweise']['extractions'][0]['correct'] = True
# Add new Extraction which has not been in result list.
data['labels']['Bruttozahlweise']['extractions'].append({'value': '123,45'})
r = requests.patch(url = url, data=json.dumps(data), auth=auth, headers={'Content-Type': 'application/json'},)
パラメーター
名前 | キー | 必須 | 型 | 説明 |
---|---|---|---|---|
ドキュメント ID
|
doc | True | string |
パッチするドキュメントの ID |
ドキュメントの抽出結果を取得する
ID を使用してドキュメントのすべての情報を取得します。処理が終了すると、抽出結果を利用できます
パラメーター
名前 | キー | 必須 | 型 | 説明 |
---|---|---|---|---|
ドキュメント ID
|
doc | True | string |
プロジェクト内のドキュメントの ID |
ドキュメントを削除します
ドキュメントを削除します。
パラメーター
名前 | キー | 必須 | 型 | 説明 |
---|---|---|---|---|
ドキュメント ID
|
doc | True | string |
削除するドキュメントの ID |
新規ドキュメントのアップロード
新規ドキュメントのアップロード
パラメーター
名前 | キー | 必須 | 型 | 説明 |
---|---|---|---|---|
ファイル
|
data_file | True | file |
ホストに送信するファイル。 |
プロジェクト ID
|
project | True | integer |
プロジェクトの ID。 |
同期応答
|
sync | boolean |
既定値は False です |
戻り値
名前 | パス | 型 | 説明 |
---|---|---|---|
データ ファイル
|
data_file | uri | |
ID
|
id | integer | |
Project
|
project | integer | |
データ ファイル名
|
data_file_name | string | |
コールバック URL
|
callback_url | uri | |
同期
|
sync | boolean | |
抽出 URL
|
extraction_url | string |