ドキュメント オートメーション - スケーリング要件

この文書は、ドキュメント オートメーションのスケーリングアプローチを概説しており、インフラ要件の特定と重要なプラットフォームコンポーネントの構成を含んでいます。

概要

ドキュメント オートメーション は抽出タスクを実行するために Bot Runners を利用します。 これらの Bot Runners はワークフローを実行するための鍵であり、それぞれが作業負荷の一部を処理します。 プラットフォームのオーケストレーションメカニズムは、利用可能な Bot Runners にタスクをインテリジェントに分配し、他のものが過負荷になっている間にアイドル状態のものがないようにします。 各 Bot Runner がタスクを完了すると、自動的に新しいタスクが割り当てられ、バランスの取れた利用が維持されます。

Bot Runnersの数を増やすことで、さまざまな文書量に対応でき、高いスループットとビジネスニーズに応じた柔軟性を提供します。これは水平スケーリングとして知られるプロセスです。 多くのシナリオでは、システム容量は追加のBot Runnersによりほぼ線形に上級しますが、ネットワーク帯域幅、データベースアクセス速度、I/O操作などの要因が、より高い上級レベルで収穫逓減を引き起こす可能性があります。

必要なリソースを決定する

最適なスケーリングアプローチを選択するには、まず必要な日々の処理量を計算します。 一日は完全な24時間のサイクルを指します。 あなたのBotの運用時間が短い場合(例えば、8時間の労働日)、Bot Runnerのスループットをそれに応じて調整してください。 例えば、特定の文書タイプの1 Bot Runner が24時間で2,400ページを処理する一方で、8時間以内に最大800ページしか処理できないと予想される場合があります。 実際の事例と処理ウィンドウに基づいてリソースを計画します。