织梦dedecms采集中用到的一些过滤规则

织梦dedecms的过滤规则写起来不是很难,规则如下:

代码示例:
{dede:trim}要过滤的内容{/dede:trim}

如果要过滤的内容很简单,完全可以把过滤规则直接写在“{dede:trim}”和“{/dede:trim}”之间。
对于比较复杂的情况,请考虑使用正则,你懂的,正则表达式,那是相当强劲的。
以下是一些过滤规则的例子,供大家参考。
1、采集中去除内容里的超链接:

代码示例:
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}

假如要将所有超链接内容都去除,规则是:

代码示例:
{dede:trim}]*)>([^<]*){/dede:trim}

这两个规则的不同通过下面代码来解释
例如文章代码中包含着如下内容:
超链接
通过第一个规则,采集结果是:超链接
2、过滤广告
对于广告来说,过滤规则就得针对html中看到的内容使用规则了,例如某些广告仅仅是引用某个JS文件,例如

代码示例:

这样的规则只需

代码示例:
{dede:trim}{/dede:trim} {dede:trim}{/dede:trim}

如果某些广告的内容是JS代码写在区间里的,例如GG的广告,那么过滤规则应该是:

代码示例:
{dede:trim}{/dede:trim}
3、一些测试过的过滤规则

代码示例:
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
//by www.jbxue.com//
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*)

{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}]*)>([^>]*)

{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}]*)>([^>]*)

{/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}

{/dede:trim} // 内容来自www.jbxue.com//
{dede:trim}]*)>([^>]*)

{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim} {dede:trim}{/dede:trim}

1. 本站实行充值兑换金币,1元=1金币,每日签到可领取1个金币,[我要充值]
2. 部分资源免费,登录后0元购买免费下载,收费资源价格也很低廉,1至100元不等,VIP会员全站无限下载,[去开通]
3. 本站正式上线, 推荐到QQ或者微信群免费获得VIP会员资格,详情[点我查看]
4. 如果您找不到合适的资源,请联系我们,告知您的需求,我们会在24小时内整理发布。
专注网站维护优化及织梦源码分享 » 织梦dedecms采集中用到的一些过滤规则

网迅云,安全稳定的云服务器,域名注册,香港空间的提供商!

虚拟主机 云服务器