织梦自带采集网站的规则

1、过滤摘要和关键字使用,经常要用到。

{dede:trim replace=''}{/dede:trim}

2、简单替换。

{dede:trim replace='替换后的词语'}要替换的词语{/dede:trim}

采集的内容当然也要求搜索引擎收录,过滤和替换目的是减少重复,进行伪原创。

3、去除超链接,这种最常用。

{dede:trim replace=''}<a([^>]*)>{/dede:trim}

{dede:trim replace=''}</a>{/dede:trim}

把链接的文本也一起干掉了这么写

{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}

4、过滤JS调用广告如下:

{dede:trim replace=''}<script([^>]*)>(.*)</script>{/dede:trim}

5、过滤div标签

这个过滤不完整就会出现错位。

{dede:trim replace=''}<div([^.]*)>{/dede:trim}

{dede:trim replace=''}</div>{/dede:trim}

也可以这样子过滤:

{dede:trim replace=''}<div 选择器>(.*)</div>{/dede:trim}

上面规则仅供大家参考学习。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wsfzpw.html