婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > php使用自帶dom擴展進行元素匹配的原理解析

php使用自帶dom擴展進行元素匹配的原理解析

熱門標簽:如何在世界地圖標注 菏澤語音外呼系統運營商 廈門400電話辦理選易號網 天客通地圖標注 地圖標注符號樣式有 臨沂crm外呼系統平臺 梧州市機器人外呼系統怎么樣 公司外呼系統中心 電子地圖標注怎么修改

DOMDocument

php提供了非常好用的解析html和xml文檔的擴展庫DOM,使用這個庫可以非常高效的進行html和xml文檔的解析,它的原理就是通過尋找首尾匹配對來進行文檔的解析。

從上面的分析可以看出,如果首位不匹配,可能就會導致一些錯誤的出現,因此,這個時候我們需要設置

libxml_use_internal_errors(true);

來進行錯誤的屏蔽,讓它可以解析整個文檔。

解析html基本用法

$dom = new \DOMDocument;
$content = htmlspecialchars_decode($content);
libxml_use_internal_errors(true);
$content = mb_convert_encoding($content, 'HTML-ENTITIES', 'UTF-8');
$dom->loadHTML($content);

$content是要解析的html字符串,其中我們對它進行了轉義,因為可能含有實體集,然后我們有進行了編碼的轉換,因為可能文檔不是utf-8格式的,會導致日文,法文等文字亂碼。

獲取元素

$a = $dom->getElementsByTagName('a');
$p = $dom->getElementsByTagName('p');

遍歷元素

$elements = $dom->getElementsByTagName('a');
foreach ($elements as $element) {
  $element->textContent = '替換成其它的文字';
}

通過上面的循環,可以將全部a標簽的文字替換掉。

元素嵌套

有些時候,html會嵌套很多層,比如

div>
p>
a href="xxx" rel="external nofollow" >我是文字/a>
/p>
p>
內容替換
/p>
/div>

如果我們想要對p標簽文字進行替換的化,并且不想要替換含有子元素的內容,就是這里的a標簽不想替換,下面的語句不能夠解決我們的問題:

$elements = $dom->getElementsByTagName('p');
foreach ($elements as $element) {
  if($element->hasChildNodes()){
    $element->textContent = 'p標簽內容替換';
  }
}

上面的代會將a標簽的內容也替換掉,這不是我們想要的結果,因為hasChildNodes()這個函數表示的含有內容,無論它是標簽還是文字,它都是返回true的,除非它是空標簽,例如

它才會返回false.

所以我們需要自己封裝一個函數進行檢查是否含有嵌套標簽。

function hasChild($element, $tags)
{
  foreach($tags as $v){
  $elements = $element->getElementsByTagName($v);

  if($elements->length){
  return true;
  }

  }
  return false;
}
$tags = array('title','h1','h2','h3','h4','h5','a','p','dd','img');  

$elements = $dom->getElementsByTagName('p');
foreach ($elements as $element) {
  if(hasChild($element, $tags)){
    $element->textContent = 'p標簽內容替換';
  }
}

通過我們自己封裝的函數,就可以判斷出$dom的node節點是否含有子標簽。

總結

到此這篇關于php使用自帶dom擴展進行元素匹配的文章就介紹到這了,更多相關php元素匹配內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • PHP代碼加密和擴展解密實戰
  • Thinkphp使用Zxing擴展庫解析二維碼內容圖文講解
  • PHP安裝擴展mcrypt以及相關依賴項深入講解
  • win10下 php安裝seaslog擴展的詳細步驟
  • PHP擴展安裝方法步驟解析
  • php使用event擴展的io復用測試的示例
  • 安裝PHP擴展時解壓官方 tgz 文件后沒有configure文件無法進行配置編譯的問題
  • PHP 擴展Memcached命令用法實例總結
  • Thinkphp 框架配置操作之動態配置、擴展配置及批量配置實例分析
  • docker 安裝 php-fpm 服務 / 擴展 / 配置的示例教程詳解
  • 如何動態查看及加載PHP擴展

標簽:綿陽 白城 雞西 瀘州 迪慶 黃石 貴陽 郴州

巨人網絡通訊聲明:本文標題《php使用自帶dom擴展進行元素匹配的原理解析》,本文關鍵詞  php,使用,自帶,dom,擴展,進行,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《php使用自帶dom擴展進行元素匹配的原理解析》相關的同類信息!
  • 本頁收集關于php使用自帶dom擴展進行元素匹配的原理解析的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 石棉县| 专栏| 廊坊市| 商都县| 阿拉尔市| 岢岚县| 纳雍县| 开封县| 北票市| 米泉市| 承德县| 方山县| 武清区| 平原县| 昌平区| 宝丰县| 腾冲县| 保德县| 上栗县| 盐池县| 宣城市| 华容县| 内乡县| 中江县| 绩溪县| 丰宁| 合肥市| 康乐县| 泰兴市| 大悟县| 恩施市| 安化县| 土默特左旗| 临泽县| 腾冲县| 泰和县| 长岛县| 平昌县| 泽库县| 阜阳市| 营山县|