Web サイトからデータを抽出

Web ページからのデータの抽出では、抽出するデータの種類に応じて 4 つの方法があります。

  • 通常のデータ: 繰り返しパターンのない非構造化データです。一続きのテキストなどが該当します。
  • パターン ベースのデータ: パターンが繰り返される構造化データです。テーブルの行やリストなどが該当します。
  • テーブル データ: テーブルに属するデータです。