火車采集器(LocoySpider)下載版本:v9.5
【軟件介紹】 火車采集器(LocoySpider)是一款專業(yè)的功能強(qiáng)大的網(wǎng)絡(luò)數(shù)據(jù)/信息挖掘軟件,通過靈活的配置,您可以很輕松的從網(wǎng)頁上抓取文字、圖片、文件等任何資源。 程序支持遠(yuǎn)程下載圖片文件,支持網(wǎng)站登陸后的信息采集,支持探測文件真實(shí)地址,支持代理,支持防盜鏈的采集,支持采集數(shù)據(jù)直接入庫和模仿人手工發(fā)布等許多功能特點(diǎn)。 火車采集器支持從任何類型的網(wǎng)站采集獲取您所需要的信息,如各種新聞?lì)惥W(wǎng)站、論壇、電子商務(wù)網(wǎng)站、求職招聘網(wǎng)站等。 同時(shí)具有強(qiáng)大的網(wǎng)站登錄采集、多頁和分頁的采集、網(wǎng)站跨層采集、POST采集、腳本頁面采集、動(dòng)態(tài)頁面采集等高級采集功能。 強(qiáng)大的php和c#插件支持,讓您可以通過二次開發(fā)實(shí)現(xiàn)您所想要的任何更強(qiáng)大的功能。
【軟件特色】 1、通用性強(qiáng) 無論新聞、論壇、視頻、黃頁、圖片、下載類網(wǎng)站,只要通過瀏覽器能看到的結(jié)構(gòu)化的內(nèi)容,通過指定匹配規(guī)則,都能采集到您所需要的內(nèi)容。 2、穩(wěn)定、高效 五年磨一劍,軟件不斷更新進(jìn)步,采集速度快,性能穩(wěn)定,占用資源少。 3、擴(kuò)展性強(qiáng)、適用范圍廣 自定義web發(fā)布,自定義主流的數(shù)據(jù)庫的保存和發(fā)布,自定義本地php及.net外部編程接口處理數(shù)據(jù),讓數(shù)據(jù)都能為你所用。 基本功能 1、規(guī)則自定義 - 通過采集規(guī)則的定義,可以搜索所有網(wǎng)站采集幾乎任何類型的信息。 2、多任務(wù),多線程 - 可以同時(shí)進(jìn)行多個(gè)信息采集任務(wù),每個(gè)任務(wù)可以使用多個(gè)線程。 3、所見即所得 - 任務(wù)采集過程所見即所得,過程中遍歷的鏈接信息、采集信息、錯(cuò)誤信息等都會及時(shí)的反映在軟件界面中。 4、數(shù)據(jù)保存 - 數(shù)據(jù)邊采集邊自動(dòng)保存到關(guān)系數(shù)據(jù)庫中,并且數(shù)據(jù)結(jié)構(gòu)能夠自動(dòng)適應(yīng),軟件可以根據(jù)采集規(guī)則自動(dòng)創(chuàng)建數(shù)據(jù)庫,以及其中的表和字段,也可以通過導(dǎo)庫方式靈活的將數(shù)據(jù)保存到客戶已有的數(shù)據(jù)庫結(jié)構(gòu)中。 5、斷點(diǎn)續(xù)采 - 信息采集任務(wù)可以在停止后從斷點(diǎn)開始繼續(xù)采集,從此你用不再擔(dān)心你的采集任務(wù)意外中斷了。 6、網(wǎng)站登錄 - 支持網(wǎng)站Cookie,支持網(wǎng)站可視化登錄,即使登錄時(shí)需要驗(yàn)證碼的網(wǎng)站也能采集。 7、計(jì)劃任務(wù) - 通過這個(gè)功能可以讓你的采集任務(wù)定時(shí)、定量或者一直循環(huán)執(zhí)行。 8、采集范圍限制 - 可以根據(jù)采集的深度和網(wǎng)址的標(biāo)識來限制采集的范圍。 9、文件下載 - 可以將采集到的二進(jìn)制文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結(jié)果數(shù)據(jù)庫中。 10、結(jié)果替換 - 可以將采集的結(jié)果根據(jù)規(guī)則替換成你定義的內(nèi)容。 11、條件保存 - 可以根據(jù)某個(gè)條件來決定那些信息保存,那些信息過濾。 12、過濾重復(fù)內(nèi)容 - 軟件可根據(jù)用戶設(shè)置和實(shí)際情況對重復(fù)內(nèi)容和重復(fù)網(wǎng)址自動(dòng)刪除重復(fù)內(nèi)容。 13、特殊鏈接識別 - 運(yùn)用此功能可以將用JavaScript動(dòng)態(tài)生成的鏈接或其他更古怪的連接識別出來。 14、數(shù)據(jù)發(fā)布 - 可以通過自定義接口,將已采集的結(jié)果數(shù)據(jù)發(fā)布到任意的內(nèi)容管理系統(tǒng)和指定數(shù)據(jù)庫中,F(xiàn)在已支持的目標(biāo)發(fā)布媒體包括:數(shù)據(jù)庫(access, sql server,my sql,oracle) ,靜態(tài)htm文件。 15、預(yù)留編程接口 - 定義多個(gè)編程接口,用戶可以在事件中利用PHP,C#語言進(jìn)行編程,擴(kuò)充采集功能。
【軟件功能】 1、支持所有網(wǎng)站編碼:完美支持采集所有編碼格式的網(wǎng)頁,程序還可以自動(dòng)識別網(wǎng)頁編碼。 2、多種發(fā)布方式:支持目前所有主流和非主流的CMS,BBS等網(wǎng)站程序,通過系統(tǒng)的發(fā)布模塊能實(shí)現(xiàn)采集器和網(wǎng)站程序間的完美結(jié)合。 3、全自動(dòng):無人值守工作,配置好程序后,程序?qū)⒁罁?jù)您的設(shè)置自動(dòng)運(yùn)行,完全無需人工干預(yù)。 4、本地編輯:本地可視化編輯已采集的數(shù)據(jù)。 5、采集測試:這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結(jié)果并測試發(fā)布。 6、管理方便:使用站點(diǎn)+任務(wù)方式管理采集節(jié)點(diǎn),任務(wù)支持批量操作,再多的數(shù)據(jù)管理也很輕松。
【更新日志】 1,批量網(wǎng)址更新,日期可以支持大于今天的數(shù)據(jù)。標(biāo)簽可以采用多參數(shù)同步變化 2,標(biāo)簽組合,增加對于循環(huán)組合的支持。 3,優(yōu)化網(wǎng)址庫排重邏輯,大大加快大網(wǎng)址庫下的任務(wù)加載速度,優(yōu)化網(wǎng)址庫排重內(nèi)存占用。 4,數(shù)據(jù)庫發(fā)布模塊,增加“insert ignore”模式的支持 5, 新增任務(wù)的云端備份、同步功能 6,http遠(yuǎn)程服務(wù)器,增加對于單條數(shù)據(jù)修改的API支持。 7,水印增加指定大小的壓縮功能 8,修復(fù)FTP,SFTP鏈接未能正確斷開的問題 9,修復(fù)Word2007無法保存圖片的問題 10,修復(fù)標(biāo)簽超長時(shí)候的顯示錯(cuò)誤問題。 11,修復(fù)標(biāo)簽數(shù)據(jù)替換中的替換錯(cuò)誤問題。 12,修復(fù)了數(shù)據(jù)倒序發(fā)布的問題。 13,優(yōu)化了幾個(gè)會導(dǎo)致采集器長時(shí)間運(yùn)行后內(nèi)存無法釋放的問題。
【軟件截圖】 火車采集器(LocoySpider)v9.4下載 行業(yè)軟件具有針對性強(qiáng)、易操作等特點(diǎn)。 |
1深度技術(shù)win10正式版ghost(32位)旗艦......
2番茄花園win10 X86 ghost 標(biāo)準(zhǔn)通......
3番茄花園Win10_Ghost Win10 64......
4雨林木風(fēng) GHOST WIN10 X64 快速裝......
5深度技術(shù)GHOST WIN10 X64 尊貴專業(yè)......
6筆記本W(wǎng)in10系統(tǒng) 64位官方正式版2023年......
7筆記本win10正式版ghost(32位)旗艦免......
8雨林木風(fēng)win10(32位)ghost 修正專業(yè)......