婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 使用HtmlAgilityPack XPath 表達式抓取博客園數據的實現代碼

使用HtmlAgilityPack XPath 表達式抓取博客園數據的實現代碼

熱門標簽:上海400客服電話怎么申請 銀行信貸電話機器人 合肥ai電銷機器人費用 天津電銷外呼系統違法嗎 凱立德地鐵站地圖標注 400電話個人能不能辦理 滄州電銷外呼系統價格 溫州外呼系統招商 手機外呼系統什么原理


Web 前端代碼

復制代碼 代碼如下:

%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default.aspx.cs" Inherits="_Default" %>
!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
html xmlns="http://www.w3.org/1999/xhtml">
head runat="server">
title>/title>
/head>
body>
form id="form1" runat="server">
div>
table cellpadding="1" cellspacing="1" bgcolor="#f1f1f1" style="text-align: center">
asp:Repeater ID="Repeater1" runat="server">
HeaderTemplate>
tr>
td>
標題
/td>
td>
發布作者
/td>
td>
發布時間
/td>
/tr>
/HeaderTemplate>
ItemTemplate>
tr bgcolor="#ffffff">
td align="left">
a href='%#Eval("url") %>' target="_blank">
%#Eval("title") %>
/a>
/td>
td>
a href='%#Eval("authorUrl") %>' target="_blank">
%#Eval("author") %>
/a>
/td>
td>
%#Eval("updatetime") %>
/td>
/tr>
/ItemTemplate>
/asp:Repeater>
/table>
/div>
/form>
/body>
/html>

cs 后臺代碼:
復制代碼 代碼如下:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;
using S1;
using System.Net;
using System.IO;
using System.Text;
using HtmlAgilityPack;
public partial class _Default : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{
string page = string.Empty;
if (!IsPostBack)
{
WebClient wc = new WebClient();
string address = "http://www.cnblogs.com";
if (!string.IsNullOrEmpty(Request.QueryString["p"]))
{
address += "/" + Request.QueryString["p"];//分頁,p=p2,p=p3
}
Stream stream = wc.OpenRead(address);
StreamReader sr = new StreamReader(stream, Encoding.UTF8);
string html = sr.ReadToEnd();
//實例化HtmlAgilityPack.HtmlDocument對象
HtmlDocument doc = new HtmlDocument();
//載入HTML
doc.LoadHtml(html);
//根據HTML節點NODE的ID獲取節點
HtmlNode navNode = doc.GetElementbyId("post_list");
//div[2]表示文章鏈接a位于post_list里面第3個div節點中
HtmlNodeCollection list = navNode.SelectNodes("http://div[2]/h3/a"); //根據XPATH來索引節點
Cnblogs cnblogs = null;
IListCnblogs> cnlist = new ListCnblogs>();
foreach (HtmlNode node in list)
{
cnblogs = new Cnblogs();
//獲取文章鏈接地址
cnblogs.url = node.Attributes["href"].Value.ToString();
//獲取文章標題
cnblogs.title = node.InnerText;
cnlist.Add(cnblogs);
}
HtmlNodeCollection list1 = navNode.SelectNodes("http://div[2]/div/a");
for (int i = 0; i cnlist.Count; i++)
{
cnlist[i].author = list1[i].InnerText;
cnlist[i].authorUrl = list1[i].Attributes["href"].Value.ToString();
cnlist[i].updatetime = list1[i].NextSibling.InnerText.Replace("發布于", "").Trim();
}
this.Repeater1.DataSource = cnlist;
this.Repeater1.DataBind();
}
}
public class Cnblogs
{
public string title { get; set; }
public string url { get; set; }
public string author { get; set; }
public string authorUrl { get; set; }
public string updatetime { get; set; }
}
}

您可能感興趣的文章:
  • c#通過xpath讀取xml示例
  • java使用xpath解析xml示例分享
  • java使用xpath和dom4j解析xml
  • DOM XPATH獲取img src值的query
  • 深入XPath的詳解以及Java示例代碼分析
  • 解析XPath語法之在C#中使用XPath的示例詳解
  • php XPath對XML文件查找及修改實現代碼
  • xpath的數據和節點類型以及XPath中節點匹配的基本方法
  • xpath簡介_動力節點Java學院整理

標簽:酒泉 洛陽 金華 七臺河 溫州 赤峰 怒江 白城

巨人網絡通訊聲明:本文標題《使用HtmlAgilityPack XPath 表達式抓取博客園數據的實現代碼》,本文關鍵詞  使用,HtmlAgilityPack,XPath,表達式,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《使用HtmlAgilityPack XPath 表達式抓取博客園數據的實現代碼》相關的同類信息!
  • 本頁收集關于使用HtmlAgilityPack XPath 表達式抓取博客園數據的實現代碼的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 沙田区| 道真| 将乐县| 长兴县| 康保县| 灵山县| 环江| 通州区| 宣恩县| 彩票| 石首市| 香港| 利川市| 澄城县| 于田县| 怀化市| 墨脱县| 东源县| 石屏县| 名山县| 黎川县| 望城县| 南康市| 板桥市| 尼勒克县| 辉县市| 福海县| 永安市| 新营市| 宝清县| 嫩江县| 礼泉县| 论坛| 张北县| 六枝特区| 五指山市| 报价| 上虞市| 哈巴河县| 陆丰市| 大石桥市|