數(shù)據(jù)采集系統(tǒng)是一款智能化的互聯(lián)網(wǎng)數(shù)據(jù)采集工具,與內容管理系統(tǒng)深度集成,可簡單快速地將目標網(wǎng)站的內容采集到自己的網(wǎng)站中,以快速填充網(wǎng)站內容,或者通過定時采集來實現(xiàn)自動轉載目標網(wǎng)站的新聞,以減少網(wǎng)站內容運維工作。
與內容管理系統(tǒng)深度集成
數(shù)據(jù)采集系統(tǒng)能夠從目標網(wǎng)站采集數(shù)據(jù),通過智能分析,將數(shù)據(jù)與指定內容模型的各個字段匹配生成相應的內容實體,并保存至指定欄目中。目標網(wǎng)頁中的圖片和附件會以文件形式保存在網(wǎng)站的上傳文件夾中。
支持數(shù)據(jù)采集的內容模型包括文章、公開信息、政策文件等。
支持多種數(shù)據(jù)源格式
采集功能完備
- 支持按正序或倒序進行數(shù)據(jù)采集。
- 支持定時采集功能。
- 支持斷點續(xù)采。
- 支持采集排重(增量采集),可以根據(jù)標題或 URL 進行排重。
- 支持自動下載內容中的圖片和附件。
- 支持自動過濾正文中的鏈接。
- 支持更新采集,即在采集所有數(shù)據(jù)的同時不清空歷史記錄,并判斷歷史記錄中是否存在相同數(shù)據(jù),若存在則更新數(shù)據(jù),否則插入新數(shù)據(jù)。
- 支持重新采集,即清空歷史記錄后重新采集全部數(shù)據(jù)。
- 支持批量執(zhí)行采集任務。
- 支持查看采集進度。
- 支持采集歷史記錄管理,用戶可以查看、刪除、清空采集歷史記錄。
- 支持僅采集為鏈接內容,并保留至源網(wǎng)頁的鏈接。
用戶登錄
還沒有賬號?
立即注冊