婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 網(wǎng)站建設(shè) > 建站知識 > Dedecms采集功能的使用方法 --- 不含分頁的普通文章(三)

Dedecms采集功能的使用方法 --- 不含分頁的普通文章(三)

POST TIME:2021-05-24 02:39

前言:本文是“不含分頁的普通文章的采集方法“的第三節(jié),在前兩節(jié)的基礎(chǔ)上,將會對“如何采集指定節(jié)點”和“如何導(dǎo)出采集內(nèi)容”做詳細(xì)的說明。為了與前文保持一致,本文將延續(xù)使用前文的章節(jié)標(biāo)記。

上接第二節(jié)。

 

3.1采集指定節(jié)點

單擊“保存并開始采集“后,將會進入”采集指定節(jié)點“界面,如(圖34)所示,

圖34-采集指定節(jié)點

 

每頁采集:設(shè)置每頁所需采集的條數(shù),并可根據(jù)網(wǎng)站是否有防刷新功能,設(shè)置采集間隔時間。

 

特殊選項:設(shè)置是否檢測重復(fù)圖片,默認(rèn)為“檢測”。

 

附加選項:此選項一共有3種采集模式可供選擇:第一種為“監(jiān)控采集模式(檢測當(dāng)前或所有節(jié)點是否有新內(nèi)容)”,選取后,系統(tǒng)只會采集指定節(jié)點中更新的內(nèi)容;第二種為“重新下載全部內(nèi)容”,選取后,系統(tǒng)會采集指定節(jié)點中的全部內(nèi)容;第三種為“下載種子網(wǎng)站的未下載內(nèi)容”,選取后,系統(tǒng)只會采集指定節(jié)點中未下載過的內(nèi)容,包括以前沒下載的和更新的內(nèi)容。

 

設(shè)置完成并確定無誤后,可單擊“開始采集網(wǎng)頁”或者“查看種子網(wǎng)址”。此時,如果單擊“查看種子網(wǎng)址”會看到列表是空的,這是因為新建立的采集節(jié)點從未采集過,如(圖35)所示,

圖35-查看節(jié)點的種子網(wǎng)址

 

單擊“開始采集網(wǎng)頁”后,系統(tǒng)便會開始采集節(jié)點中設(shè)置的網(wǎng)址,并出現(xiàn)相關(guān)提示,如(圖36)所示,

圖36-采集進程中提示信息

 

采集結(jié)束后,再次單擊“查看種子網(wǎng)址”或者單擊頁面右上角的“查看已下載”,便可看到已采集到的網(wǎng)址信息,如(圖37)所示,

圖37-查看節(jié)點的種子網(wǎng)址

 

成功采集以后,可以根據(jù)實際需要選擇頁面右上角的單擊“采集節(jié)點管理”或者“導(dǎo)出數(shù)據(jù)”。單擊“導(dǎo)出數(shù)據(jù)“后,便可進入” 采集管理> 采集內(nèi)容導(dǎo)出“界面,如(圖38)所示,

圖38-采集內(nèi)容導(dǎo)出

 

“默認(rèn)導(dǎo)出欄目“:設(shè)置要把采集到的內(nèi)容導(dǎo)入到的欄目

 

“批量采集選項”:如果在采集規(guī)則中已指定欄目ID,則可使用此功能,若指定的欄目ID為0,系統(tǒng)會把采集內(nèi)容導(dǎo)入到“默認(rèn)導(dǎo)出欄目”所選擇的欄目中。

 

“發(fā)布選項“:有發(fā)布成“普通文檔”和“保存為草稿”可供選擇。

 

“每批導(dǎo)入“:設(shè)置每批導(dǎo)入的條數(shù),此數(shù)不宜過大。

 

“附帶選項“:此處為多選。如果不希望采集到重復(fù)的文章標(biāo)題,可選中“排除重復(fù)標(biāo)題”;如果希望被采集到的內(nèi)容直接生成HTML的話,可選中“完成后自動生成導(dǎo)入內(nèi)容HTML”;如果希望系統(tǒng)在采集列表頁時自動識別標(biāo)題名,可選中“使用列表索引的標(biāo)題”,一般不建議勾選。

 

“隨機推薦”:填入一個數(shù)字,代表文檔篇數(shù)。在所填入的文檔篇數(shù)內(nèi)隨機出現(xiàn)一篇推薦文檔,若填入“0”,則表示為不推薦。

 

設(shè)置完成后,可單擊“確定”,就可以把下載的導(dǎo)入到所選的欄目中了,如(圖39)所示,

圖39-設(shè)置完成后的采集內(nèi)容導(dǎo)出頁面

 

同時,系統(tǒng)將會有導(dǎo)出進程提示,如(圖40)所示,

圖40-采集內(nèi)容導(dǎo)出中的提示信息

 

導(dǎo)出采集內(nèi)容提示“完成所有欄目列表更新”后,單擊“瀏覽欄目”,便可進入網(wǎng)站的相關(guān)頁面查看到采集到的文章列表及其具體內(nèi)容。也可在后臺管理界面的主菜單中單擊“核心”,然后單擊“普通文章”,進入“文檔列表”頁面,查看所采集到的文章列表,如(圖41)所示,

圖41-文檔列表

 

到此為止,已成功采集到了目標(biāo)網(wǎng)站的文章內(nèi)容。

 

總結(jié),采集“不含分頁的普通文章”還是相對比較簡單的,由于本篇文章是一篇基礎(chǔ)教程,因此并沒有過多的涉及到“過濾規(guī)則”。對于“含有分頁的普通文章”的采集方法及過濾規(guī)則的使用,將會在下一篇文章中介紹。

 

附上本文的采集規(guī)則:


{dede:listconfig}
{dede:noteinfo notename="采集測試(一)" channelid="1" macthtype="string"
refurl="http://www.dedecms.com/knowledge/web-based/dreamweaver/2009/0929/765.html" sourcelang="gb2312" cosort="asc" isref="no" exptime="10" usemore="0" /}

{dede:listrule sourcetype="batch" rssurl="http://" regxurl="http://www.dedecms.com/knowledge/web-based/dreamweaver/list_47_(*).html"
startid="1" endid="1" addv="1" urlrule="area"
 musthas=".html" nothas="" listpic="1" usemore="0"}
    {dede:addurls}{/dede:addurls}
    {dede:batchrule}{/dede:batchrule}
    {dede:regxrule}{/dede:regxrule}
    {dede:areastart}<div class="arc_list">{/dede:areastart}
    {dede:areaend}</div>{/dede:areaend}
{/dede:listrule}

{/dede:listconfig}

{dede:itemconfig}
{dede:sppage sptype='full' sptype='full' srul='1' erul='5'}{/dede:sppage}
{dede:previewurl}http://www.dedecms.com/knowledge/web-based/dreamweaver/2009/0929/765.html{/dede:previewurl}
{dede:keywordtrim}{/dede:keywordtrim}
{dede:descriptiontrim}{/dede:descriptiontrim}
{dede:item field='title' value='' isunit='' isdown=''}
   {dede:match}<div class="arcbody"><h1>[內(nèi)容]</h1>{/dede:match}
   
   {dede:function}{/dede:function}
{/dede:item}
{dede:item field='writer' value='' isunit='' isdown=''}
   {dede:match}作者:<font color="red">[內(nèi)容]</font>{/dede:match}
   
   {dede:function}{/dede:function}
{/dede:item}
{dede:item field='source' value='' isunit='' isdown=''}
   {dede:match}來源:<font color="red">[內(nèi)容]</font>{/dede:match}
   
   {dede:function}{/dede:function}
{/dede:item}
{dede:item field='pubdate' value='' isunit='' isdown=''}
   {dede:match}發(fā)表于:<font color="red">[內(nèi)容]</font>{/dede:match}
   
   {dede:function}@me=GetMkTime(@me);{/dede:function}
{/dede:item}
{dede:item field='body' value='' isunit='1' isdown='1'}
   {dede:match}<div class="content">[內(nèi)容]</div>{/dede:match}
   
   {dede:function}{/dede:function}
{/dede:item}

{/dede:itemconfig}



收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢

  • 400-1100-266
主站蜘蛛池模板: 洞头县| 三台县| 上犹县| 娄烦县| 桃江县| 井研县| 五华县| 长阳| 贡觉县| 施秉县| 蒲江县| 溆浦县| 新民市| 安仁县| 晋州市| 临邑县| 海原县| 精河县| 乐平市| 永新县| 深州市| 光山县| 虹口区| 义乌市| 米脂县| 清水河县| 汝城县| 白水县| 普兰店市| 望都县| 隆德县| 穆棱市| 什邡市| 贡嘎县| 仪征市| 绥芬河市| 新和县| 庆城县| 华亭县| 汉寿县| 呼伦贝尔市|