検証ルールで正規表現抽出アクションを使用する
- 最終更新日2024/10/31
検証ルールで正規表現抽出アクションを使用する
正規表現抽出アクションでは、ドキュメントから抽出された値にカスタムの正規表現 (regex) を適用できます。このアクションにより、ユーザーは指定した正規表現パターンに基づいて特定の部分文字列を抽出して抽出データを操作できます。
ドキュメントが処理されて値が抽出されたら、この値に対して正規表現抽出アクションを適用できます。抽出値の特定部分の識別と抽出に使用する正規表現パターンを定義できます。
注: これは、指定の正規表現パターンに基づいて、その値で見つかった最初の一致のみを抽出します。
前提条件
- 正規表現抽出アクションを適用すると、抽出時に最初の正規表現に一致するフィールド値が設定されます。
- 指定した正規表現がフィールドに一致しない場合、空のフィールド値が返されます。
- 更新 (v.31) パッケージをラーニングインスタンスに接続していない場合は、このルールが期待通りに動作しない可能性があることを示す警告メッセージが表示されます。
例
この機能は、抽出データの一部だけが必要な状況で特に有用です。たとえば、より大きな文字列から特定の数字の集合を抽出したり、住所の一部を分離したり、テーブルの説明から特定の断片を取り出したりする場合です。
次の例では、ドキュメントの Description 列から Vendor Code を抽出する場合、Description 列からすべての説明テキストを取得します。次の画像は、通常の抽出処理による Vendor Code の値を示しています。
この例では、ドキュメントの Description 列から Vendor Code だけを抽出する方法を見ていきます。