Automation 360

検証ルールで正規表現抽出アクションを使用する

PDF としてダウンロード

PDF としてダウンロード

正規表現抽出アクションでは、ドキュメントから抽出された値にカスタムの正規表現 (regex) を適用できます。このアクションにより、ユーザーは指定した正規表現パターンに基づいて特定の部分文字列を抽出して抽出データを操作できます。

ドキュメントが処理されて値が抽出されたら、この値に対して正規表現抽出アクションを適用できます。抽出値の特定部分の識別と抽出に使用する正規表現パターンを定義できます。

注: これは、指定の正規表現パターンに基づいて、その値で見つかった最初の一致のみを抽出します。

正規表現抽出アクションを適用すると、抽出時に最初の正規表現に一致するフィールド値が設定されます。
指定した正規表現がフィールドに一致しない場合、空のフィールド値が返されます。
更新 (v.31) パッケージをラーニングインスタンスに接続していない場合は、このルールが期待通りに動作しない可能性があることを示す警告メッセージが表示されます。

この機能は、抽出データの一部だけが必要な状況で特に有用です。たとえば、より大きな文字列から特定の数字の集合を抽出したり、住所の一部を分離したり、テーブルの説明から特定の断片を取り出したりする場合です。

次の例では、ドキュメントの Description 列から Vendor Code を抽出する場合、Description 列からすべての説明テキストを取得します。

次の画像は、通常の抽出処理による Vendor Code の値を示しています。

正規表現抽出アクションの適用前

この例では、ドキュメントの Description 列から Vendor Code だけを抽出する方法を見ていきます。

ドキュメントを処理するには、[処理] をクリックします。

指定した正規表現パターンに基づいて、Description 列から Vendor Code の値のみが抽出されます。

次の画像は、正規表現抽出アクションの適用後の Vendor Code の値を示しています。

正規表現抽出アクションを使用したベンダーコード抽出

以下は、抽出に使用できる正規表現パターンの例です。

注: これらの正規表現パターンは固定されたものではなく、事例の要件によって異なる場合があります。