海运的博客

iMacros读取和采集数据写入文件

发布时间:June 26, 2013 // 分类:iMacros // No Comments

读取CSV文件,按行和列读取:

'csv文件
SET !DATASOURCE Address.csv
'开始于第几行
SET !DATASOURCE_LINE {{!LOOP}}
'变量COL针对相应的列
TAG POS=1 TYPE=INPUT:TEXT FORM=ID:demo ATTR=NAME:fname CONTENT={{!COL1}}

采集网页数据并保存到CSV文件:

URL GOTO=http://www.baidu.com/
TAG POS=1 TYPE=A ATTR=HREF:http://baike.baidu.com EXTRACT=TXT
SET !VAR1 {{!EXTRACT}}<SP>Ext.<Sp>
SET !EXTRACT NULL
TAG POS=1 TYPE=A ATTR=HREF:http://wenku.baidu.com EXTRACT=TXT
SET !VAR2 {{!EXTRACT}}
SET !EXTRACT NULL
ADD !EXTRACT {{!var1}}
ADD !EXTRACT {{!var2}}
SAVEAS TYPE=EXTRACT FOLDER=R: FILE=test.csv

iMacros采集参数:

TYPE:HTML标签
XPATH:和TYPE二选一
ATTR:标签属性,*表示所有,可用TXT(网页显示的文字),HREF,Class/ID名称
POS:第几个匹配
EXTRACT:采集数据类型,可选:TXT,HREF,HTM等

标签:imacros, csv

发表评论

分类
最新文章
最近回复
  • spartan2: https://dashboard.hcaptcha.com/welcome_accessib...
  • 海运: 应该能,在购买页面先手工跳过cf机器验证,后续一定时间内不更换ip应该不会再次验证。
  • spartan: 大佬斯巴达开启了CF的机器识别验证,请问插件能自动跳过吗? 另外这个脚本有没有简单使用说明,新...
  • vincent: 膜拜大佬
  • 海运: proxy-header或proxy_protocol
  • liangjw: 如果是 内部调用 或者 中间存在 代理 而上一个代理又在内网 ,那怎么处理来自代理私有IP?
  • chainofhonor: 感谢,用dnsmasq设置自动判断BIOS和UEFI成功了
  • 海运: 不好意思,这个是很多年前的,现在也许已经不适用,我现在也不用多线了。
  • CQ: -m state --state NEW 替换成-m conntrack --ctstate NEW
  • CQ: 你好,我入站已经成功分流,但是不知道出站怎么设置,PREROUTING替换成POSTROUTI...