织梦自带采集网站的规则

日期：2021-04-28 栏目：程序人生浏览：次

1、过滤摘要和关键字使用，经常要用到。

{dede:trim replace=''}{/dede:trim}

2、简单替换。

{dede:trim replace='替换后的词语'}要替换的词语{/dede:trim}

采集的内容当然也要求搜索引擎收录，过滤和替换目的是减少重复，进行伪原创。

3、去除超链接，这种最常用。

{dede:trim replace=''}<a([^>]*)>{/dede:trim}

{dede:trim replace=''}</a>{/dede:trim}

把链接的文本也一起干掉了这么写

{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}

4、过滤JS调用广告如下：

{dede:trim replace=''}<script([^>]*)>(.*)</script>{/dede:trim}

5、过滤div标签

这个过滤不完整就会出现错位。

{dede:trim replace=''}<div([^.]*)>{/dede:trim}

{dede:trim replace=''}</div>{/dede:trim}

也可以这样子过滤：

{dede:trim replace=''}<div 选择器>(.*)</div>{/dede:trim}

上面规则仅供大家参考学习。