win7系統(tǒng)下載
當(dāng)前位置: 首頁 > 網(wǎng)絡(luò)軟件教程 > 詳細(xì)頁面

WebHarvy-網(wǎng)頁數(shù)據(jù)抓取軟件-WebHarvy下載 v6.3.0.189免費(fèi)版

WebHarvy-網(wǎng)頁數(shù)據(jù)抓取軟件-WebHarvy下載 v6.3.0.189免費(fèi)版
  • 軟件大。翰榭
  • 軟件語言:簡體中文
  • 授權(quán)方式:免費(fèi)軟件
  • 更新時間:2023-08-19
  • 軟件類型:國產(chǎn)軟件
  • 推薦星級:
  • 運(yùn)行環(huán)境:XP,Win7,Win8,Win10,Win11
軟件介紹
分享到: 0

WebHarvy是一款網(wǎng)頁數(shù)據(jù)抓取工具,軟件可以提取網(wǎng)頁里的文本及圖片,輸入網(wǎng)址即可打開,默認(rèn)使用內(nèi)部瀏覽器,支持?jǐn)U展分析,可以自動獲取類似鏈接的列表,軟件界面直觀操作簡單。

WebHarvy(網(wǎng)頁數(shù)據(jù)抓取軟件)

功能介紹

智能識別模式

WebHarvy自動識別網(wǎng)頁中出現(xiàn)的數(shù)據(jù)模式。所以,如果你需要從一個網(wǎng)頁刮項(xiàng)目(姓名,地址,電子郵件,價格等)的列表,你不需要做任何額外的配置。如果數(shù)據(jù)重復(fù),WebHarvy會自動刮。

導(dǎo)出捕獲的數(shù)據(jù)

可以保存從各種格式的網(wǎng)頁中提取的數(shù)據(jù)。 WebHarvy網(wǎng)站刮板的當(dāng)前版本允許你導(dǎo)出的刮數(shù)據(jù)作為XML,CSV,JSON或TSV文件。您還可以刮下數(shù)據(jù)導(dǎo)出到一個SQL數(shù)據(jù)庫。

從多個頁面提取

通常網(wǎng)頁顯示數(shù)據(jù),如在多個頁面中的產(chǎn)品目錄。 WebHarvy可以自動抓取并從多個網(wǎng)頁中提取數(shù)據(jù)。只是指出了“鏈接到下一頁'和WebHarvy網(wǎng)站刮板將自動刮從所有頁面的數(shù)據(jù)。

直觀化的操作界面

WebHarvy是一個可視化的網(wǎng)頁提取工具。其實(shí)完全沒有必要編寫任何腳本或代碼用來提取數(shù)據(jù)。使用webharvy的內(nèi)置瀏覽器瀏覽網(wǎng)頁。您可以選擇用鼠標(biāo)點(diǎn)擊來提取數(shù)據(jù)。它是那么容易!

基于關(guān)鍵字的提取

基于關(guān)鍵字的提取可讓您捕捉從搜索結(jié)果頁面輸入關(guān)鍵字的列表數(shù)據(jù)。您創(chuàng)建的配置將被自動重復(fù)所有給定輸入關(guān)鍵字,而挖掘的數(shù)據(jù)?梢灾付ㄈ我鈹(shù)量的輸入關(guān)鍵字

提取分類

WebHarvy網(wǎng)站刮板允許您從一個鏈接列表,從而導(dǎo)致一個網(wǎng)站內(nèi)的相似頁面抽取數(shù)據(jù)。這使您可以使用一個單一的配置刮網(wǎng)站內(nèi)的類別或小節(jié)。

使用正則表達(dá)式提取

WebHarvy可以應(yīng)用正則表達(dá)式(正則表達(dá)式)在文本或網(wǎng)頁的HTML源代碼,并提取去匹配的部分。這種強(qiáng)大的技術(shù)為您提供了更多的靈活性,同時拼搶的數(shù)據(jù)。

軟件特色

WebHarvy是一個視覺網(wǎng)絡(luò)刮板。絕對不需要編寫任何腳本或代碼來抓取數(shù)據(jù)。您將使用WebHarvy的內(nèi)置瀏覽器瀏覽網(wǎng)頁。您可以選擇要點(diǎn)擊的數(shù)據(jù)。這很容易!

WebHarvy自動識別網(wǎng)頁中發(fā)生的數(shù)據(jù)模式。因此,如果您需要從網(wǎng)頁上刮取項(xiàng)目列表(名稱,地址,電子郵件,價格等),則無需執(zhí)行任何其他配置。如果數(shù)據(jù)重復(fù),WebHarvy會自動刪除它。

您可以以多種格式保存從網(wǎng)頁中提取的數(shù)據(jù)。WebHarvy Web Scraper的當(dāng)前版本允許您將抓取的數(shù)據(jù)導(dǎo)出為Excel,XML,CSV,JSON或TSV文件。您也可以將抓取的數(shù)據(jù)導(dǎo)出到SQL數(shù)據(jù)庫。

通常,網(wǎng)頁在多個頁面上顯示產(chǎn)品列表等數(shù)據(jù)。WebHarvy可以自動抓取并從多個頁面提取數(shù)據(jù)。只需指出“鏈接到下一頁”,WebHarvy Web Scraper就會自動從所有頁面中抓取數(shù)據(jù)。

更新日志

修復(fù)了頁面啟動的時候可能導(dǎo)致禁用連接

可以對頁面模式配置專屬的連接方式

可以自動搜索HTML上可以配置的資源

增加了鍵盤向下滾動下一頁的功能

增加了通過Java腳本加載下一頁。

添加了URL配置的功能

可以將關(guān)鍵字輸入一個列表上2搜索


常見的網(wǎng)絡(luò)操作系統(tǒng)有UNIX、Netware、Windows NT、Linux等,網(wǎng)絡(luò)軟件的漏洞及缺陷被利用,使網(wǎng)絡(luò)遭到入侵和破壞。

[溫馨提示]:
點(diǎn)下面下載:(推薦使用"迅雷"進(jìn)行下載,系統(tǒng)下載大全QQ交流群:)