午夜视频国产在线,九九精品99久久久香蕉,欧美在线视频二区,老司机在线精品视频网站,久久久精品免费,97国产品香蕉在线观看

您的位置:首 頁 > 新聞中心 > 行業(yè)動態(tài) > 行業(yè)動態(tài)采集范圍

行業(yè)動態(tài)

行業(yè)動態(tài)采集范圍

發(fā)布:2020-11-15 12:26:55 瀏覽:3432

       采集范圍。網(wǎng)頁檔案的采集有不同的采集策略,不同的采集策略決定了不同的采集范圍,可分為完整型采集、選擇型采集以及混合型采集。

       完整型采集是對特定網(wǎng)域的全域進(jìn)行自動化采集,采集范圍廣、內(nèi)容多。美國的IA宗旨是保存互聯(lián)網(wǎng)的全面記錄,對全球公開的網(wǎng)站進(jìn)行定期采集。每兩個月,網(wǎng)站頁面快照都會被互聯(lián)網(wǎng)存檔,自IA項(xiàng)目啟動以來,互聯(lián)網(wǎng)存檔已經(jīng)存儲了2730億個網(wǎng)頁。

       選擇型采集是有針對性地捕獲特定的網(wǎng)站,通常是根據(jù)事件、主題進(jìn)行選擇采集,采集范圍小,需要借助人力。例如,澳大利亞的PANDORA項(xiàng)目只采集與澳大利亞相關(guān),且具有文化意義的網(wǎng)站;美國國會圖書館的Library of Congress Web Archives(以下簡稱LCWA)項(xiàng)目,重點(diǎn)采集與國家利益主題相關(guān)的網(wǎng)頁資源,包括美國選舉、伊拉克戰(zhàn)爭和911事件;蘇格蘭的NRS網(wǎng)頁檔案項(xiàng)目,事先制定指南,根據(jù)指南采集其范圍內(nèi)組織創(chuàng)建和擁有的網(wǎng)站,包括蘇格蘭政府、蘇格蘭議會、蘇格蘭法院等。
       混合型采集是將兩種策略相結(jié)合,先大范圍地對網(wǎng)站進(jìn)行完整采集,再有重點(diǎn)地針對某些特定的網(wǎng)站進(jìn)行深度、頻繁的選擇性采集。英國的UKWA項(xiàng)目,首先爬網(wǎng)內(nèi)容是在英國發(fā)布的網(wǎng)站,如那些在英國頂級域名上的網(wǎng)站.uk、.cymru和.scot,以及可以手動識別出在英國發(fā)布的網(wǎng)站,再由工作人員定期關(guān)注、收集有關(guān)特定事件、主題或興趣領(lǐng)域的網(wǎng)站。

>>> 查看《行業(yè)動態(tài)采集范圍》更多相關(guān)資訊 <<<

本文地址:http://m.yunshengqh.cn/news/html/21662.html

趕快點(diǎn)擊我,讓我來幫您!
嘉禾县| 枣庄市| 万州区| 遂昌县| 兰溪市| 太原市| 曲周县| 永善县| 三明市| 盐源县| 志丹县| 兴国县| 濮阳市| 九龙县| 多伦县| 达尔| 丰原市| 深泽县| 伊宁市| 麟游县| 宣城市| 河津市| 临邑县| 泽库县| 茌平县| 福建省| 上杭县| 尉氏县| 湘阴县| 延长县| 衡阳县| 江孜县| 若羌县| 太仓市| 尉氏县| 清苑县|