八爪魚采集器,是一款通用性網(wǎng)頁采集軟件,可視化所現(xiàn)即所得操作,無須編程能力,即可采集任意網(wǎng)頁數(shù)據(jù)。并提供分布式云采集增值服務(wù),支持高并發(fā)大存儲(chǔ)采集。2013年上線,現(xiàn)版本已經(jīng)更新到5.1版,10W用戶使用。常見采集場景包括QQ號碼,電話號碼,手機(jī)號碼采集,郵箱采集,文章采集,客戶資源采集,網(wǎng)頁圖片采集,淘寶買家賣家商品采集,與織夢DEDE,WORDPRESS,DISCUZ,完美兼容。
八爪魚采集器軟件特性
八爪魚采集器,是一款通用性網(wǎng)頁采集軟件,可視化所現(xiàn)即所得操作,無須編程能力,即可采集任意網(wǎng)頁數(shù)據(jù)。并提供分布式云采集增值服務(wù),支持高并發(fā)大存儲(chǔ)采集。2013年上線,現(xiàn)版本已經(jīng)更新到5.1版,10W用戶使用。常見采集場景包括QQ號碼,電話號碼,手機(jī)號碼采集,郵箱采集,文章采集,客戶資源采集,網(wǎng)頁圖片采集,淘寶買家賣家商品采集,58同城趕集百姓分類信息采集,與織夢DEDE,WORDPRESS,DISCUZ,完美兼容。
八爪魚采集器安裝步驟: 1.先解壓所有文件。 2.請雙擊setup.exe開始安裝。 3.安裝完成后在開始菜單或者桌面均可以找到八爪魚采集器快捷方式。 4.啟動(dòng)八爪魚采集器,需要先登錄才能使用各項(xiàng)功能。 5.如果已經(jīng)在八爪魚網(wǎng)站注冊并激活賬號,請使用該賬號登錄。 如果沒有注冊過,請點(diǎn)擊登錄界面的“免費(fèi)注冊”鏈接,或者直接打開,先注冊并激活賬號。 6.第一次使用時(shí),請仔細(xì)查看使用指南(使用指南僅在第一次使用時(shí)出現(xiàn)一次)。 7.開始自己配置任務(wù)前,建議先打開樣本任務(wù)熟悉軟件使用,然后再對照“主頁”上的視頻教程學(xué)習(xí)練習(xí)一下。 8.新手建議先學(xué)習(xí)教程,或者從規(guī)則市場,數(shù)據(jù)市場中尋找自己需要的數(shù)據(jù)或者采集規(guī)則。
八爪魚采集器更新日志
八爪魚采集器8.2.6 迭代功能 更新自定義模式的布局,調(diào)整界面各部分尺寸,調(diào)整步驟高級選項(xiàng)的位置; 調(diào)整高級選項(xiàng)的層級關(guān)系,統(tǒng)一XPath的配置。 Bug修復(fù) 修復(fù)部分包含下拉框任務(wù)無法采集完整問題。
八爪魚采集器8.2.0 頁面無內(nèi)容更新時(shí),可提前結(jié)束滾動(dòng)。 自動(dòng)跳過無效的翻頁操作。 支持瀑布流網(wǎng)頁的邊滾動(dòng)邊采集。 支持網(wǎng)頁的邊點(diǎn)擊加載更多內(nèi)容,邊采集。 自動(dòng)識別支持在列表項(xiàng)、詳情信息等結(jié)果之間切換。
八爪魚采集器8.1.22 Bug修復(fù) 解決部分列表網(wǎng)頁自動(dòng)識別結(jié)果不正確的問題
八爪魚采集器8.1.18 Bug修復(fù) 解決軟件無法自動(dòng)升級的問題
八爪魚采集器8.1.16 新增功能 增加按字段去除重復(fù)數(shù)據(jù)功能 查看詳情 增加導(dǎo)出采集數(shù)據(jù)到Oracle功能 查看詳情 增加導(dǎo)出采集數(shù)據(jù)到JSON文件功能 Bug修復(fù) 解決自定義配置中拖動(dòng)步驟到判斷條件中異常的問題 解決自定義配置中多次復(fù)制字段后導(dǎo)致字段丟失的問題 解決自定義配置中在數(shù)據(jù)預(yù)覽中操作字段相關(guān)的問題 解決自定義配置中有時(shí)不同網(wǎng)頁內(nèi)容重疊在一起的問題 解決部分任務(wù)本地采集時(shí)錯(cuò)誤的提示需要補(bǔ)采的問題 解決自定義配置中編輯任務(wù)后未顯示修改未保存標(biāo)識的問題 解決采集模板詳情中有時(shí)信息顯示不全的問題 解決自定義配置中流程圖添加采集步驟菜單顯示不全的問題 解決自定義配置中流程圖中有時(shí)循環(huán)項(xiàng)顯示不正確的問題 解決點(diǎn)擊側(cè)邊菜單欄最近編輯任務(wù)打開任務(wù)不顯示網(wǎng)頁的問題
八爪魚采集器8.1.14 主要體驗(yàn)改進(jìn) 自定義任務(wù)配置中增加列表相關(guān)的設(shè)置引導(dǎo) 自定義任務(wù)配置中增加網(wǎng)頁中沒有要采集數(shù)據(jù)時(shí)的設(shè)置引導(dǎo) 自定義任務(wù)配置中優(yōu)化檢測到Ajax后的設(shè)置引導(dǎo) 自定義任務(wù)配置中優(yōu)化自動(dòng)識別結(jié)果的設(shè)置引導(dǎo) 自定義任務(wù)配置中加入表單類是網(wǎng)頁自動(dòng)識別,識別率約80%+ Bug修復(fù) 解決八爪魚打開后,電腦長時(shí)間睡眠,重新喚醒后八爪魚白屏問題
八爪魚采集器8.1.12 主要體驗(yàn)改進(jìn) 本地采集增加了對7版本采集任務(wù)的正則兼容 優(yōu)化自定義配置中在全部字段中刪除字段后預(yù)覽數(shù)據(jù)的刷新機(jī)制 Bug修復(fù) 解決自定義配置中添加采集步驟菜單顯示位置不正確的問題 解決升級新版本后任務(wù)列表打不開的問題 解決自定義配置中拖動(dòng)調(diào)整數(shù)據(jù)預(yù)覽中字段順序白屏的問題 解決自定義配置中刪除數(shù)據(jù)預(yù)覽中字段或數(shù)據(jù)行時(shí)提示操作框顯示錯(cuò)誤的問題 解決采集模板中列表類型的參數(shù)無法配置的問題 解決本地采集中鼠標(biāo)移動(dòng)到元素上不生效的問題 解決定時(shí)采集中設(shè)置日期會(huì)出錯(cuò)的問題 解決自定義配置中JSON任務(wù)添加字段會(huì)白屏的問題 解決任務(wù)列表中任務(wù)組模式下批量啟動(dòng)云采集會(huì)長時(shí)間卡住的問題 解決自定義配置中添加固定字段后修改字段名錯(cuò)誤的問題 解決自定義配置中循環(huán)提取固定元素列表預(yù)覽數(shù)據(jù)不顯示的問題 解決自定義配置中部分網(wǎng)站無法獲取Cookie的問題 解決定時(shí)采集中設(shè)置按周、按月定時(shí)采集下一次采集時(shí)間不正確的問題 解決定時(shí)采集中設(shè)置間隔時(shí)間1分鐘采集不生效的問題 解決自定義配置中有時(shí)修改任務(wù)名保存不生效的問題 解決自定義配置中設(shè)置字段抓取屬性值-選擇屬性值的時(shí)候流程圖區(qū)域會(huì)隱藏的問題 解決自定義配置中第一次進(jìn)入時(shí)引導(dǎo)提示背景出現(xiàn)用戶調(diào)查界面的問題 解決任務(wù)列表中刷新后篩選條件重置的問題 解決自定義配置中修改任務(wù)名時(shí)標(biāo)簽頁中的任務(wù)保存標(biāo)識不正確的問題
八爪魚采集器8.1.8 主要體驗(yàn)改進(jìn): 改善安裝卸載錯(cuò)誤日志記錄方式
八爪魚采集器8.1.4
主要體驗(yàn)改進(jìn) 優(yōu)化網(wǎng)頁列表數(shù)據(jù)自動(dòng)識別,將識別率提高到90%以上 Bug修復(fù) 解決自定義配置中循環(huán)輸入文本中循環(huán)項(xiàng)重復(fù)的問題 解決自定義配置當(dāng)前頁面數(shù)據(jù)預(yù)覽中有時(shí)會(huì)多出一列空數(shù)據(jù)的問題 解決自定義配置中有時(shí)候自動(dòng)識別生成的采集流程不正確的問題 解決自定義配置當(dāng)前頁面數(shù)據(jù)預(yù)覽中拖動(dòng)改變字段順序后修改字段名錯(cuò)誤的問題 解決本地采集中部分網(wǎng)頁Cookie不生效問題 解決自定義配置中自動(dòng)識別生成的采集字段中有空格的問題 解決本地采集中部分網(wǎng)站無法滾動(dòng)加載數(shù)據(jù)的問題 解決本地采集中某些情況下數(shù)據(jù)格式化不正確的問題 解決自定義配置提取數(shù)據(jù)配置中修改字段后沒有應(yīng)用也生效的問題 解決自定義配置中部分網(wǎng)頁自動(dòng)識別有時(shí)會(huì)卡住的問題 解決自定義配置自動(dòng)識別的數(shù)據(jù)預(yù)覽中有時(shí)修改字段名會(huì)白屏的問題 解決主界面左側(cè)賬戶過期時(shí)間顯示的問題 解決自定義配置中某些操作會(huì)造成流程圖錯(cuò)亂的問題
八爪魚采集器7.4.42018-06-22 主要體驗(yàn)改進(jìn): 【自定義模式】支持采集網(wǎng)址數(shù)量,從2萬擴(kuò)展到100萬級別 【自定義模式】網(wǎng)址輸入支持文本導(dǎo)入,支持txt、xls、xlsx、csv格式 【自定義模式】網(wǎng)址輸入支持批量生成網(wǎng)址參數(shù),包括數(shù)字變化、字母變化、時(shí)間變化、自定義類表四種生成方式 【自定義模式】支持任務(wù)跟隨采集,A采集的網(wǎng)址作為B任務(wù)的輸入源進(jìn)行關(guān)聯(lián)采集,拓寬使用場景 【任務(wù)列表】任務(wù)列表可根據(jù)「云采集完成時(shí)間」來排序 【其他】任務(wù)錯(cuò)誤報(bào)告導(dǎo)出支持excel格式 Bug修復(fù): 修復(fù)本地驗(yàn)證碼識別出錯(cuò)問題 修復(fù)云采集正則替換失效問題
八爪魚采集器V7.2.2 2017-12-25 升級提醒: 系統(tǒng)不支持自動(dòng)從6.x自動(dòng)升級到7.x,使用6.x版的用戶請單獨(dú)下載V7.x版本再安裝使用。 主要體驗(yàn)改進(jìn): 【任務(wù)管理】可自定義每頁顯示任務(wù)數(shù)量(10、20、50、100),大批量任務(wù)管理更方便 【任務(wù)管理】優(yōu)化頁面刷新體驗(yàn),減少無效刷新 【自定義模式】可將無關(guān)聯(lián)的幾個(gè)元素,組成一組列表鏈接進(jìn)行循環(huán)采集,適應(yīng)更多場景需求 【自定義模式】創(chuàng)建任務(wù)時(shí),可同時(shí)設(shè)置任務(wù)組 【其他】可購買任務(wù)控制API Bug修復(fù): 修復(fù)增量采集失效問題,提高增量采集可靠性 修復(fù)填入大量URL時(shí)引起的性能問題 修復(fù)部分客戶端崩潰問題
八爪魚采集器V7.1.82017-11-19 升級提醒: 系統(tǒng)不支持自動(dòng)從6.x自動(dòng)升級到7.x,使用6.x版的用戶請先卸載:開始->八爪魚->卸載,再安裝V7.x。 主要體驗(yàn)改進(jìn): 增加智能防封(代理IP)功能,點(diǎn)擊查看詳細(xì)說明 提供驗(yàn)證碼單獨(dú)購買渠道,無需捆綁套餐購買 自定義模式,智能輔助框去掉「更多操作」,直接展示全部配置選項(xiàng) Bug修復(fù): 修復(fù)部分客戶端崩潰問題 修復(fù)字段名出現(xiàn)亂碼問題
八爪魚采集器V7.1.6 2017-11-02 升級提醒: 系統(tǒng)不支持自動(dòng)從6.x自動(dòng)升級到7.x,使用6.x版的用戶請先卸載:開始->八爪魚->卸載,再安裝V7.x。 主要體驗(yàn)改進(jìn): 改進(jìn)主要頁面UI設(shè)計(jì),優(yōu)化圖標(biāo)、背景色、對話框設(shè)計(jì) 集成新內(nèi)核,解決舊版內(nèi)核中,一大批網(wǎng)頁無法打開的問題 客戶端首頁加入新手教程,合并APP&網(wǎng)站簡易采集模式 自定義模式--智能輔助框增加「撤銷本次選擇」功能 自定義模式--選中元素列表時(shí),顯示列表數(shù)量,方便校對 自定義模式--可以將無關(guān)聯(lián)的元素,組成一組列表 優(yōu)化自定義模式中選擇元素的相關(guān)操作 在Xpath參考庫中增加XPath教程 Bug修復(fù): 【循環(huán)打開網(wǎng)頁】URL太長導(dǎo)致內(nèi)存溢出,無法再修改規(guī)則 本地采集出現(xiàn)錯(cuò)誤報(bào)表后,彈窗必須手動(dòng)點(diǎn)擊 在查看數(shù)據(jù)界面,內(nèi)容數(shù)據(jù)長度超長,導(dǎo)致查看數(shù)據(jù)卡住,甚至崩潰 修復(fù)若干Bug
八爪魚采集器V7.1.4 2017-09-25 升級提醒: 系統(tǒng)不支持自動(dòng)從6.x自動(dòng)升級到7.x,使用6.x版的用戶請先卸載:開始->八爪魚->卸載,再安裝V7.x。 體驗(yàn)改進(jìn): 新增UserAgent切換功能,有效規(guī)避網(wǎng)頁防采集(包括火狐45、54、55,火狐手機(jī)版29、谷歌瀏覽器最新版) 增加「檢測工作流異常」功能,當(dāng)工作流出錯(cuò)時(shí)將會(huì)檢測及自動(dòng)修復(fù) 加入「關(guān)于我們」,可以查看客戶端版本及檢測更新 目前可以在「自動(dòng)導(dǎo)出數(shù)據(jù)庫」時(shí)選用已保存的導(dǎo)出配置 刪除單個(gè)任務(wù)加上確認(rèn)提示,避免誤操作 優(yōu)化編輯任務(wù)名體驗(yàn) 導(dǎo)出數(shù)據(jù)時(shí),導(dǎo)出數(shù)據(jù)范圍默認(rèn)跟隨當(dāng)前頁面篩選條件,避免誤操作 移除「發(fā)布到網(wǎng)站」功能 Bug修復(fù): 修復(fù)「新增字段后進(jìn)行采集,導(dǎo)致數(shù)據(jù)丟失」的問題 修復(fù)「預(yù)覽包含大量內(nèi)容的字段導(dǎo)致崩潰」問題 修復(fù)「當(dāng)任務(wù)名稱太長時(shí),自動(dòng)導(dǎo)出里無法顯示任務(wù)」的問題 修復(fù)IT桔子打開異常問題(需要手動(dòng)切換UA為火狐54、火狐29) 修復(fù)智能模式加載下一頁出錯(cuò)問題
八爪魚采集器6.4.3
升級提醒: 八爪魚采用云存儲(chǔ)技術(shù),因此升級或者重新安裝都不會(huì)影響用戶的數(shù)據(jù),請放心升級。 升級內(nèi)容: 修復(fù)點(diǎn)擊網(wǎng)頁不彈出選擇框的問題
八爪魚采集器6.42016-12-09
升級提醒: 八爪魚采用云存儲(chǔ)技術(shù),因此升級或者重新安裝都不會(huì)影響用戶的數(shù)據(jù),請放心升級。 升級內(nèi)容: 添加識別驗(yàn)證碼功能,云采集支持自動(dòng)識別驗(yàn)證碼,單機(jī)采集支持自動(dòng)識別和手工輸入 添加執(zhí)行計(jì)劃設(shè)置的功能,并可以使用已保存的計(jì)劃批量應(yīng)用到多個(gè)任務(wù)上 修復(fù)導(dǎo)出到Mysql必須需要mysql數(shù)據(jù)庫權(quán)限的問題 優(yōu)化單機(jī)采集速度 優(yōu)化軟件內(nèi)存占用高的問題
八爪魚采集器V6.2.12016-09-26
升級是否影響用戶數(shù)據(jù)?八爪魚采用云存儲(chǔ)技術(shù),因此升級或者重新安裝都不會(huì)影響用戶的數(shù)據(jù),請放心升級。 修復(fù)文章正文分頁合并導(dǎo)出后的數(shù)據(jù)會(huì)有多條 修復(fù)找不到時(shí)使用默認(rèn)值設(shè)置失效 查看數(shù)據(jù)添加直接查看某頁面的數(shù)據(jù)的功能 翻頁次數(shù)可以設(shè)置更大的值 修復(fù)打開網(wǎng)頁重試無效的問題 添加右鍵刷新任務(wù)和任務(wù)組的功能  
常見的網(wǎng)絡(luò)操作系統(tǒng)有UNIX、Netware、Windows NT、Linux等,網(wǎng)絡(luò)軟件的漏洞及缺陷被利用,使網(wǎng)絡(luò)遭到入侵和破壞。
|