ラーニングインスタンスのマネージ
- 最終更新日2023/04/05
ラーニングインスタンスのマネージ
ラーニングインスタンスは、単一のドキュメント タイプ (請求書など) のデータを記述する IQ Bot 構造です。ドキュメントで使われている言語や、抽出するフィールドなどの情報が含まれています。
ラーニングインスタンスは、ステージング モードと本番環境モードのいずれかです。これらのモードにより、ラーニングインスタンスが下書きであるかライブ バージョンであるかが決まります。
- ステージング
-
ステージング モードでは、ラーニングインスタンスの作成と編集、サンプル ドキュメントのアップロード、アップロードしたサンプル ドキュメントからデータを抽出するための Bots のトレーニングを行うことができます。本番環境にデプロイされる前にラーニングインスタンスおよび Bots のテストを行って、精度を向上させることができます。
注: ステージング モードのラーニングインスタンスによって生成されるデータは、サンプル ドキュメントに基づいているため、本番環境モードのラーニングインスタンスに関するデータとは別個に保管されます。たとえば、サンプル ドキュメントは組織の購入済みページ数にはカウントされません。詳細については、「ダッシュボードの確認」を参照してください。 - 本番環境
- 本番環境モードでは、ラーニングインスタンスが実際のビジネス ドキュメントを自動的に処理して、データを抽出し、手動での検証が必要なドキュメントを検証キューに送ることができます。
ラーニングインスタンスがどのモードであるかを調べるには、[ラーニングインスタンス] タブに移動します。ここでは、[ラーニングインスタンス] ページに環境内のラーニングインスタンスが表示されます。各ラーニングインスタンスの [アクション] 列にはトグルがあり、ステージング (トグルを左にするとグレーになります) か本番環境 (トグルを右にするとオレンジになります) かが示されます。
- ステージング環境では、1 つのラーニングインスタンスにつきファイル サイズ 10MB のドキュメントを最大 150 個までアップロードできます。
- 本番環境では、1 つのドキュメントにつき最大 50MB のファイル サイズをアップロードできます。ただし、1 つのラーニングインスタンスにつき許可される最大ドキュメント数は、ライセンスによって異なります。
- pdfbox OCR では、1 つのドキュメントあたりのページ数に制限はありません。
- 画像ベースの OCR では、1 つのドキュメントにつき 60 ページをアップロードできます。
- Tesseract4 OCR で、1 つのドキュメントあたりのページ数が 60 ページ未満に制限される既知の制限事項があります。
ラーニングインスタンスのライフサイクル
次の図は、ラーニングインスタンスの一般的なライフサイクルを示しています。
移行ユーティリティを使用することで、環境間でラーニングインスタンスを移行することができます。これにより、類似のラーニングインスタンスを再作成する必要がなくなり、関連する Bots. のライフサイクルをより適切に管理できるようになります。詳細については、「ラーニングインスタンスの移行」を参照してください。