今天又发现了一个好东西分享给大家,有些时候使用关关采集器的时候会发现,有些网站的目录页地址是这样的
<td class=’L’><a href=”23692901.html”>28.第28章 差点穿帮</a></td>
<td class=”L”><a href=’23692902.html’>29.第29章 酒吧</a></td>
<td class=”L”><a href=”23692903.html”>30.第30章 并不在意</a></td>
发现问题了吗,中间的引号有些是单引号,有些是双引号,这个时候写规则就不好写了,其实只需要一点东西就能够写了,写好的规则在下面,大家参考下就知道了。
href=[“|’](\d*).html[“}’].*?>.+?</a>
当然这个只是获取章节id的,具体的就不说了,大家可以参考这个进行写。
发布者:彬彬笔记,转载请注明出处:https://www.binbinbiji.com/jieqizhuanqu/2014.html