构建Bot Insight控制面板 bot
在此示例中,您构建了 bot,可从网站检索数据以在 Bot Insight 中创建可视化效果。
过程
-
打开新 bot:
- 从 Control Room中,选择 “博茨 > 我的爬虫程序”。
- 单击 创建新 > 爬虫程序。
- 在 创建任务爬虫 程序窗口中,输入 bot 名称。
-
接受默认文件夹位置 \Boths\。
要更改 bot 的存储位置,请单击 “选择 ”,然后按照提示操作。
- 单击 创建和编辑。
-
打开要从中提取表格的网页的浏览器窗口。
- 双击或拖动浏览器 > 启动网站 action。
- 在 URL 字段中,输入 https://www.statista.com/statistics/183483/ranking-of-languages-spoken-at-home-in-the-us-in-2008/。
-
选择 Internet Explorer 浏览器。
Recommended: 使用 Microsoft Internet Explorer,因为它可在新窗口中可靠地启动网站,即使另一个窗口已经打开。如果有打开的窗口,其他浏览器可能会在新选项卡中启动网站。
- 单击保存。
-
单击运行。
bot 将打开窗口。
-
选择要提取的表。
- 双击或拖动记录器 > 捕获 action。
-
单击窗口选项卡,然后从下拉列表中选择 Languages spoken in the United States 2018 | Statista 窗口。
如果窗口标题未显示在列表中,请单击刷新。
-
单击捕获对象。
Languages spoken in the United States 2018 | Statista 窗口已激活。
- 悬停在表上,直至出现围绕整个表的橙色框。
- 单击表格。
- 返回 Control Room。
-
在对象属性表中,验证控件类型为 TABLE。
如果不是,请单击重新捕获对象。
- 从 Action 下拉列表中选择获取表格。
-
为将输出分配给变量字段创建
tLanguages
变量。
-
指定要保存数据的文件。
- 双击或拖动数据表 > 写入至文件 action。
- 从数据表名称列表中,选择 tLanguages。
-
请提供文件路径以创建 CSV 文件。
例如,C:\Users\<username>\Desktop\LanguagesTable.csv。
- 选择创建文件夹/文件(如果不存在)选项。
- 选择以覆盖现有文件。
-
指定保存提取数据的文件。
- 双击或拖动 CSV/TXT > 打开 action。
- 为步骤 4 中指定的文件提供文件路径。
- 选择包含标题选项以排除第一行。
-
迭代文件的每一行。
- 双击或拖动循环 action。
- 选择 CSV/TXT 中每一行迭代器
-
在将当前行分配给此变量字段中,创建变量
rCurrentRow
。
-
指定数据以填充 Bot Insight 控制面板。
- 双击或拖动分析 > 打开action。
- 双击或拖动字符串 > 分配action。
-
输入 $rCurrentRow[0]$ 作为源字符串。
按 F2 打开变量菜单。
-
在选择目标字符串变量字段中,创建变量
sLanguage
。 -
双击或拖动字符串 > 替换 action。
提取数据使用逗号分隔数字。必须先删除逗号,然后才能将字符串转换为要在 Bot Insight 中使用的数字数据类型。
-
输入 $rCurrentRow[1]$ 作为源字符串。
按 F2 打开变量菜单。
- 在查找字符串字段中输入 ,。
- 选择不是正则表达式选项。
- 在替换为字段中,输入 $sNull$。
-
在将输出分配给变量字段中,创建
sPopulation
变量。 - 双击或拖动字符串 > 到数字 action。
-
输入
$sPopult$
变量。 -
为将输出分配给变量字段创建
nPopulation
变量。 - 双击或拖动分析 > 关闭 action。
-
选择以下变量:
- sLanguage
- nPopulation
- 单击保存并运行。
-
单击分析。
将显示 Bot Insight 窗口。