系統簡介:
對互聯網資源進行周期性歸檔保存,提供原版原貌展現,實現歸檔內容全文檢索、主題匯聚等應用。針對不同用戶需求,提供機構聯盟版、機構專業版、機構標準版、個人專業版,個人標準版。
功能特點
1、采集管理
基于用戶設定的互聯網對象,根據用戶創建的 任務,從互聯網采集對應的資源、重寫URL并進行存儲。
• 編目管理
• 爬蟲分布式管理
• 任務多機并行采集
• 資源增量采集、斷點續采
• 爬蟲任務統計,任務進度監控管理
2、存儲管理
基于長期保存標準與規范,采用數據庫與文件目錄的形式,存儲采集資源。
• 支持異構數據庫存儲
• 支持分布式并行存儲
• 支持"接插式"存儲與管理
• 支持數據庫與文件目錄相結合
• 支持數據庫與分布式文件系統相結合
• 支持網絡存儲和定期自動備份
• 支持存儲節點容災
• 支持存儲節點統計
• 支持多種文件壓縮格式的存儲
3、發布管理
網絡歸檔平臺內的資源可以通過對象目錄、時間目錄、主題目錄等形式展現存儲的歸檔對象,并對各對象進行原版原貌展現。
• 歸檔對象的全文檢索
• 多種目錄形式資源導航
• 靈活自定義主題目錄
• 歸檔對象的原版原貌展現
4、平臺管理
管理員可以在后臺對用戶權限、采集任務、數據庫存儲分配、采集主題等信息靈活的進行配置與管理。
5、體系結構
系統支持信息采集、存儲、展現可伸縮式三層架構,信息采集和存儲層支持熱插拔。
應用效果
1、機構專業級
針對新聞信息出版和監控機構、行業主管機構、信息收藏機構(如圖書館、檔案館、信息研究所、文化遺產機構)等專業級機構所轄新聞信息傳播、監控、收藏等互聯網站點進行歷史版本保存與原版原貌再現,并提供專業級別利用、分析。
2、機構聯盟級
多家專業級機構可以組成橫向(區域)歸檔聯盟、縱向(行業)歸檔聯盟、網絡歸檔聯盟,通過分工協作、分布式存儲完成地區、行業、網絡的站點保存歸擋。
3、機構標準級
非專業級機構可以歸擋保存與自身行業、專業相關的網絡專題站點、機構內部網站及其它對機構有價值的站點。
4、個人專業級
針對有專業需求的個人用戶,提供個人專業級網站保存歸檔服務,實現個人學術研究、文化遺產保存、網絡興趣歷史保存。
5、個人標準級
普通個人用戶可以任意在本機對自己的個人站點、博客、感興趣的站點進行本地普通級歸檔保存。
適用范圍
1、新聞信息出版和監控機構、行業主管機構、信息收藏機構(如圖書館、檔案館、信息研究所、文化遺產機構)。
2、個人學術研究者、個人文化遺產保護者、其它個人爰好者。