M78探索者 大佬有话说 :
火车头采集9.8版正则采集的问题
大佬们,网上的9.8版本正则提取能用吗,我在https://tool.oschina.net/regex/测试完的表达式
怎么填都不管用了,倒是纯正则替换功能表达式能正常运行,除了<title>(?<content>[sS]*?)</title>能匹配东西,其他任何表达式都不行,比如匹配个数字(?<content>d),难道格式有错误?
M78探索者 大佬有话说 :
https://i.loli.net/2020/03/12/2sXeylvJRmrVi63.png
Uler 大佬有话说 :
title直接前后截取不是更好吗
用xpath也行呀