海运的博客

iMacros读取和采集数据写入文件

发布时间:June 26, 2013 // 分类:iMacros // No Comments

读取CSV文件,按行和列读取:

'csv文件
SET !DATASOURCE Address.csv
'开始于第几行
SET !DATASOURCE_LINE {{!LOOP}}
'变量COL针对相应的列
TAG POS=1 TYPE=INPUT:TEXT FORM=ID:demo ATTR=NAME:fname CONTENT={{!COL1}}

采集网页数据并保存到CSV文件:

URL GOTO=http://www.baidu.com/
TAG POS=1 TYPE=A ATTR=HREF:http://baike.baidu.com EXTRACT=TXT
SET !VAR1 {{!EXTRACT}}<SP>Ext.<Sp>
SET !EXTRACT NULL
TAG POS=1 TYPE=A ATTR=HREF:http://wenku.baidu.com EXTRACT=TXT
SET !VAR2 {{!EXTRACT}}
SET !EXTRACT NULL
ADD !EXTRACT {{!var1}}
ADD !EXTRACT {{!var2}}
SAVEAS TYPE=EXTRACT FOLDER=R: FILE=test.csv

iMacros采集参数:

TYPE:HTML标签
XPATH:和TYPE二选一
ATTR:标签属性,*表示所有,可用TXT(网页显示的文字),HREF,Class/ID名称
POS:第几个匹配
EXTRACT:采集数据类型,可选:TXT,HREF,HTM等

标签:imacros, csv

发表评论

分类
最新文章
最近回复
  • crowjin: 你确定这能过滤??不是所有请求都返回空地址::?
  • : linux系统上单个网卡多条宽带拨号获取公网IP,外网可以访问这些IP,有偿! Q:25299...
  • 硅谷少年: 非常有用,感谢分享
  • spartan2: https://dashboard.hcaptcha.com/welcome_accessib...
  • 海运: 应该能,在购买页面先手工跳过cf机器验证,后续一定时间内不更换ip应该不会再次验证。
  • spartan: 大佬斯巴达开启了CF的机器识别验证,请问插件能自动跳过吗? 另外这个脚本有没有简单使用说明,新...
  • vincent: 膜拜大佬
  • 海运: proxy-header或proxy_protocol
  • liangjw: 如果是 内部调用 或者 中间存在 代理 而上一个代理又在内网 ,那怎么处理来自代理私有IP?
  • chainofhonor: 感谢,用dnsmasq设置自动判断BIOS和UEFI成功了