从网页表格中提取数据的示例
- Updated: 2023/04/26
构建一个 bot 来打开浏览器窗口到 Wikipedia网站,从表格中提取数据,并将其写入桌面上的 CSV 文件。 此示例使用来自 actions、Browser、Data Table 和 Recorder Window 的 packages。
过程
要从表格中提取数据,请执行以下步骤:
-
创建新 bot:
- 在左侧窗格中,单击自动化。
- 单击 + 创建 > 任务机器人。
- 在创建任务机器人窗口中,输入 bot 名称。
-
接受默认文件夹位置:\Bots\
要更改默认 bot 存储位置,请单击选择,按照提示操作。
- 单击创建和编辑。
注: 单一 bot 的默认最大大小为 50 MB。
有关 bot 命名约定的信息,请参阅 创建您的第一个 bot。
-
打开浏览器窗口到您将从中提取表格的网页。
- 双击或拖动 浏览器 > 打开 action。
- 选择您的首选浏览器。
- 在要打开的链接字段中,输入 https://en.wikipedia.org/wiki/Table_(information)。
- 单击保存。
-
单击运行。
bot 将打开窗口。
-
指定表格。
- 双击或拖动 录制器 > 捕获 action。
-
从最右侧面板的窗口选项中,选择浏览器选项卡,然后从下拉列表中选择 表格(信息)- Wikipedia 窗口。
如果窗口标题未显示在列表中,请单击刷新。
-
单击捕获对象。
表格(信息)- Wikipedia 窗口将被激活。
-
将鼠标悬停在基本描述标题下的“年龄”表格上。
表格周围将出现一个橙色的方框。
-
单击表格。
将出现对象处理消息框。
- 返回 Control Room。
-
在对象属性表中,验证控件类型是否为 TABLE。
如果不是,请单击重新捕获对象。
- 从对对象采取的操作下拉列表中选择获取表格。
-
在将结果保存到变量字段中,创建
Tabledata
变量。
表格(信息)- Wikipedia 窗口将保存为变量$Browser1$
。 -
指定要保存数据的文件。
- 双击或拖动 数据表 > 写入文件 action。
-
从数据表名称列表中,选择
Tabledata
。 -
在输入文件名字段中,选择您的文件。
例如,C:\Users\<username>\Desktop\WikipediaTable.csv。
- 选择以覆盖现有文件。
-
关闭表格(信息)-Wikipedia 窗口。
- 双击或拖动 浏览器 > 关闭 action。
-
选择变量选项卡并插入
$Browser1$
。
- 单击保存。
-
单击运行。
bot 在桌面上创建一个 CSV 文件,其中包含七个索引的数据、其值和净变化。