婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 網站建設 > 建站知識 > 織夢dedecms采集中用到的一些過濾規則

織夢dedecms采集中用到的一些過濾規則

POST TIME:2017-11-13 01:04

dedecms的過濾規則寫起來不是很難,規則如下:

代碼示例:
{dede:trim}要過濾的內容{/dede:trim}


如果要過濾的內容很簡單,完全可以把過濾規則直接寫在“{dede:trim}”和“{/dede:trim}”之間。
對于比較復雜的情況,請考慮使用正則,你懂的,正則表達式,那是相當強勁的。

以下是一些過濾規則的例子,供大家參考。

1、采集中去除內容里的超鏈接:

代碼示例:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}


假如要將所有超鏈接內容都去除,規則是:

代碼示例:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}


這兩個規則的不同通過下面代碼來解釋
例如文章代碼中包含著如下內容:
<a href="#">超鏈接</a>
通過第一個規則,采集結果是:超鏈接

2、過濾廣告
對于廣告來說,過濾規則就得針對html中看到的內容使用規則了,例如某些廣告僅僅是引用某個JS文件,例如

代碼示例:
<script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>


這樣的規則只需

代碼示例:
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim}


如果某些廣告的內容是JS代碼寫在<script></script>區間里的,例如GG的廣告,那么過濾規則應該是:

代碼示例:
{dede:trim}<script>(.*)</script>{/dede:trim}

3、一些測試過的過濾規則

代碼示例:

{dede:trim}<!–(.*)–>{/dede:trim}
{dede:trim}<select([^>]*)>([^>]*)</select>{/dede:trim}
{dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim}
{dede:trim}<select([^>]*)>{/dede:trim}
{dede:trim}</select>{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}

//by www.jbxue.com//
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim} // 內容來自www.jbxue.com//
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<script>(.*)</script>{/dede:trim}
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim} // 本文



收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢

  • 400-1100-266
主站蜘蛛池模板: 株洲市| 万载县| 和林格尔县| 濮阳县| 沙坪坝区| 关岭| 南汇区| 化州市| 遂宁市| 巴彦淖尔市| 翁源县| 陵川县| 临朐县| 炎陵县| 贵溪市| 乐昌市| 鱼台县| 日土县| 全州县| 英吉沙县| 高邑县| 响水县| 徐水县| 海林市| 时尚| 新乡县| 洛南县| 克山县| 南川市| 黄大仙区| 汤阴县| 防城港市| 察雅县| 临汾市| 抚顺县| 米脂县| 华池县| 含山县| 宝坻区| 聊城市| 抚州市|