老司机午夜福利视频,翘臀嫩美少年被调教爽到失禁,国产精品无码翘臀在线观看,美女100%裸体无遮挡

網(wǎng)頁(yè)數(shù)據(jù)抓取之自動(dòng)分類功能

2016-09-10 14:17:52 瀏覽:8198

我們?cè)谑褂没疖嚥杉鬟M(jìn)行數(shù)據(jù)抓取的時(shí)候,會(huì)需要將采集內(nèi)容包含某個(gè)字的所有內(nèi)容都替換為某個(gè)固定的內(nèi)容。使用場(chǎng)景如:我們從網(wǎng)站采集城市名稱,然后城市名稱示例:浙江省杭州市,我們需要將這個(gè)內(nèi)容替換為杭州,這時(shí)就可以使用自動(dòng)分類功能。

下面以百度為例介紹下用法,首先在火車采集器V9建立規(guī)則,內(nèi)容采集規(guī)則的標(biāo)簽編輯如下:

1.png

 

如上圖,我們想要將包含百度的標(biāo)題 內(nèi)容更替換為常用搜索網(wǎng)站,則寫成如下格式:

2.png

 

運(yùn)行結(jié)果為:

3.png

 

就是數(shù)據(jù)抓取時(shí)將某字段所有內(nèi)容自動(dòng)分類的使用方法,在操作需要注意的是

1、一行一個(gè)分類,可以寫多個(gè)分類。若是一個(gè)關(guān)鍵詞符合多個(gè)分類,則優(yōu)先替換上面的分類,火車采集器中是按照從上至下的原則替換。

2若是所有分類不符合的情況下,你想要將關(guān)鍵詞賦予為一個(gè)默認(rèn)值,按下圖操作:

 

4.png


學(xué)會(huì)數(shù)據(jù)抓取的自動(dòng)分類操作,對(duì)包含同類字段的內(nèi)容進(jìn)行分類就方便多了,大家也操作試試吧。

掃碼關(guān)注微信
札达县| 南宁市| 新兴县| 石嘴山市| 佛学| 龙门县| 全南县| 紫阳县| 金华市| 平安县| 西乌珠穆沁旗| 冀州市| 玉山县| 水城县| 阿拉善右旗| 施甸县| 托克逊县| 西乌| 调兵山市| 浦城县| 封丘县| 公安县| 双辽市| 中阳县| 疏勒县| 扶绥县| 县级市| 黄平县| 抚州市| 鹤岗市| 内丘县| 屏山县| 恩施市| 清河县| 平乐县| 葫芦岛市| 昌吉市| 应用必备| 平果县| 咸阳市| 宜兰县|