婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > TP5框架使用QueryList采集框架爬小說操作示例

TP5框架使用QueryList采集框架爬小說操作示例

熱門標簽:正規電銷機器人系統 濟源百應電銷機器人聯系方式 重慶外呼電銷系統多少錢 嘟嘟云外呼系統 南寧電話外呼系統線路 辦理400電話哪家好點 咸陽電銷 邢臺400電話辦理 南京3D地圖標注

本文實例講述了TP5框架使用QueryList采集框架爬小說操作。分享給大家供大家參考,具體如下:

最近想寫一個小說網站,就去搜資料,搜出來TP5可以使用QueryList采集框架去爬小說,這里我來給大家詳解如何用QueryList去爬小說。
#首先應該下載TP5框架,然后在extend里面建立一個文件夾命名為QL,再去官網下載QueryList,然后把phpQuery.php 和 QueryList.php 兩個文件放在QL文件夾下,如圖:

##在QueryList.php里面加上命名空間:

namespace QL;
require ‘phpQuery.php';

use phpQuery,Exception,ReflectionClass;
use Monolog\Logger;
use Monolog\Handler\StreamHandler;
use Iterator,Countable,ArrayAccess;//使用phpQuuery接口

#準備工作做好了下來開始采集小說(我們這里以https://www.17k.com/這個網站的免費小說為例)

##先找到你要采集的小說的目錄頁面的url作為采集url

##再在url前面加上 view-source: 查看他的源碼,找到包含所有章節url的class屬性,寫好采集規則,執行語句進行采集

##采集他的章節名和每一章節的url,因為url采集下來沒有域名,需要用正則表達式加上https://www.17k.com 然后采用for循環去一個一個采集每一章節的內容

##最后再將采集到的章節名與章節內容存入數據庫

直接上代碼:

?php
namespace app\index\Controller;
use think\Controller;
use QL\QueryList;
 
class Xiaoshuo extends Controller
{
  public function index()
  {
    //采集目標
    //$url = 'https://www.17k.com/list/3032846.html?offset=';
     $url = 'https://www.17k.com/list/3041226.html?offset=';
    //采集規則
    $rules = array(
          'title'=>array('.ellipsis','text'),//獲取書每個章節名
          'link'=>array('.Volume a','href','-.folding -copy -a'),//獲取每個章節鏈接
        );
    //開始采集
    $data = QueryList::Query($url,$rules)->data;
    //var_dump($data);
    //求數組長度
     $j = count($data);
    if($data)
    {
      for($i=0;$i=$j-1;$i++)
      {
       $values = ['title'=>$data[$i]['title'],'link'=>$data[$i+1]['link']];
       $_POST['url']=$data[$i+1]['link'];
       if (!preg_match("/^(http|ftp):/", $_POST['url']))//給鏈接加上域名頭
        {
         $url1 = 'https://www.17k.com'.$_POST['url'];
        }
       $rules1 = array(
          'novel'=>array('.p','text','-li -a'),
          );
       $data1 = QueryList::Query($url1,$rules1)->data;
       //var_dump($data1);
       $values1 = ['title'=>$data[$i]['title'],'novel'=>$data1[0]['novel']];//將章節名、內容插入數據庫
       $data2 = \think\Db::name('novel6')->insert($values1); 
      }
    }
    
  }
}

我們來打印一下他的章節名和章節內容:
注:1.class屬性一定要找對
2.采集下來 $data 的第一個數組的link不是第一章的url,下一個才是第一章的,所以 data[ data[" role="presentation" style="position: relative;">data[i+1][‘link'] 是他第i章的url

更多關于thinkPHP相關內容感興趣的讀者可查看本站專題:《ThinkPHP入門教程》、《thinkPHP模板操作技巧總結》、《ThinkPHP常用方法總結》、《codeigniter入門教程》、《CI(CodeIgniter)框架進階教程》、《Zend FrameWork框架入門教程》及《PHP模板技術總結》。

希望本文所述對大家基于ThinkPHP框架的PHP程序設計有所幫助。

您可能感興趣的文章:
  • 基于ThinkPHP5框架使用QueryList爬取并存入mysql數據庫操作示例
  • php使用QueryList輕松采集js動態渲染頁面方法
  • thinkphp 抓取網站的內容并且保存到本地的實例詳解
  • jquery+thinkphp實現跨域抓取數據的方法
  • thinkphp5 URL和路由的功能詳解與實例
  • ThinkPHP5查詢數據及處理結果的方法小結
  • TP5(thinkPHP5)框架基于ajax與后臺數據交互操作簡單示例
  • thinkphp5.1 文件引入路徑問題及注意事項
  • thinkPHP5(TP5)實現改寫跳轉提示頁面的方法
  • tp5(thinkPHP5)框架數據庫Db增刪改查常見操作總結
  • thinkphp5 加載靜態資源路徑與常量的方法
  • tp5(thinkPHP5)框架實現多數據庫查詢的方法

標簽:黃山 南通 武漢 平頂山 通遼 唐山 隴南 河南

巨人網絡通訊聲明:本文標題《TP5框架使用QueryList采集框架爬小說操作示例》,本文關鍵詞  TP5,框架,使用,QueryList,采集,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《TP5框架使用QueryList采集框架爬小說操作示例》相關的同類信息!
  • 本頁收集關于TP5框架使用QueryList采集框架爬小說操作示例的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 双辽市| 玉溪市| 普宁市| 中牟县| 黄石市| 灵璧县| 舞阳县| 洞口县| 新郑市| 无棣县| 宁陵县| 广河县| 托克托县| 博爱县| 临武县| 台南市| 田林县| 夏邑县| 文登市| 西充县| 安仁县| 桃园市| 宜州市| 普宁市| 武隆县| 监利县| 西乌珠穆沁旗| 辉南县| 岚皋县| 井陉县| 东至县| 济源市| 华池县| 寿宁县| 花莲县| 清水县| 凤阳县| 雷州市| 马公市| 都兰县| 乌兰浩特市|