ボリューム階層

ビジネスの要件や組織の規模に応じて、スケーリング要件は3つのボリュームティアに分類されます。

低ボリューム
小規模ビジネスや文書処理ニーズが低いチームに適しています。
  • 処理能力: 1日あたり最大2,400ページ(1時間あたり100ページ)。
  • 通常は単一の Bot Runner によって管理されます。
中程度のボリューム
中規模の組織や文書処理要件が中程度の部門に最適です。
  • 処理能力: 1日あたり最大10,000ページ(1時間あたり400~500ページ)。
  • 2から5のBot Runnersを利用して作業負荷を処理します。
ハイボリューム
大規模な企業や文書処理ニーズが多い組織に最適です。
  • 処理能力: 1日あたり10,000ページ以上(1時間あたり500ページ以上)。
  • 最適なパフォーマンスには Bot Runners が5以上必要です。

ボリュームごとの推奨事項

低ボリュームの推奨事項
低ボリュームの事例では、推奨される構成に従えば、単一のBot Runnerで十分です。 ボリュームが低いため、詳細な調整は一般的に不要で、設定が簡単です。 ただし、デフォルトのワークフローと設定がベースラインと一致していることを確認し、予期しない遅延を避けてください。
中程度のボリュームの推奨事項
必要な Bot Runners の数を決定するには、総処理量を1時間あたり100ページまたは1日あたり2,400ページのベースラインパフォーマンスで割ります。 例えば、必要なボリュームが1日あたり6,000ページの場合、3 Bot Runners が必要です。 中規模事例の主な考慮事項には、以下が含まれます。
  • キャリブレーション: デバイスのパフォーマンスをベースラインに対してキャリブレーションします。 パフォーマンスが大きく異なる場合は、推奨される設定に従っていることを確認してください。
  • プロバイダーの違い: Automation Anywhere 以外の抽出モデルを使用する場合、Microsoft 標準フォーム (ドキュメントインテリジェンス) や Google Document AI など、30% のパフォーマンス向上が期待されます。
  • 複数ページのドキュメント: 一般的に、複数ページの文書は、時間あたりの処理ページ数においてより高いパフォーマンスを示します。
  • LLMを使用する: LLMを取り入れることで、特にフィールド数が多い場合やドキュメントサイズが大きい場合、またはドキュメントの複雑さが増す場合に処理時間が増加する可能性があります。
  • キュー管理 ワークフローボトルネックを解消するために、キューサイズが100未満の場合にのみリクエストを作成する タスク Bot を使用します。 これはシステムの過負荷を防ぎ、よりスムーズな操作を保証します。 詳細なガイダンスはここにあります。
高ボリュームの推奨事項
大量のシナリオでは、中程度のボリュームに対して概説された考慮事項が適用され、テストとインフラストラクチャの最適化により大きな重点が置かれます。
  • 予備テスト: 実際のサンプルを使用したテストは、大量処理において不可欠です。ページごとの処理時間のわずかな違いでも、必要なBot Runnersの数に大きな影響を与える可能性があります。
  • 専用の取り込みBots : Bot Runnersの一部をドキュメントの取り込み専用に割り当てて、キューを常にアクティブに保ち、タスクの割り当てに遅れが生じないように検討してください。
  • 一般的なボトルネック:
    • ネットワーク混雑: 単一のネットワーク共有を使用すると、遅延が発生する可能性があります。 複数の Bot Runners にアップロードとダウンロードを分配し、別々のフォルダーを使用して並列処理を確保します。
    • データベースパフォーマンス: オンプレミスのデータベースをCPU/メモリ使用量、I/O操作、潜在的なデッドロックのために監視します。
    • ワークフロー最適化: 可能な場合は、抽出ステップと後処理ステップを統合し、ストレートスループロセス (STP) フローを使用することで、展開時間を短縮します。