【排名大師】如何分析網(wǎng)站日志
網(wǎng)站日志最重要是記錄網(wǎng)站在運(yùn)營過程中存在的各種問題,通過網(wǎng)站日志可以清楚地得知用戶在什么IP、什么時間、用什么操作系統(tǒng)、什么瀏覽器、什么分辨率顯示器的情況下訪問了你網(wǎng)站的哪個頁面,是否訪問成功。
網(wǎng)站日志數(shù)據(jù)分析解讀如下。
(1)訪問次數(shù)、停留時間、抓取量
從這些項(xiàng)數(shù)據(jù)中可以得知:平均每歡抓取頁面數(shù)、單頁抓取停留時間和平均每次停留時間。平均每次抓取頁面數(shù)=總抓取量/訪問次數(shù),單頁面抓取停留時間=每次停留/每次抓取,平均每次停留時間=總停留時間訪問次數(shù)。
(2)目錄抓取統(tǒng)計(jì)
通過日志分析我們可以看到網(wǎng)站哪些目錄受蜘蛛喜歡、抓取目錄深度、重要頁面目錄抓取狀況、無效頁面目錄抓取狀況等。
(3)頁面抓取
在網(wǎng)站日志分析中,我們可以看到具體被蜘蛛爬取的頁面。在這些頁面中,我們可以分析出蜘蛛爬取了哪些需要被禁止爬取的頁面、爬取了哪些無收錄價值頁面、爬取了哪些重復(fù)頁面URL等。為充分利用蜘蛛資源,我們需要將這些地址在Robots.txt中禁止爬取。
(4)蜘蛛訪問IP
通過蜘蛛的IP段和前三項(xiàng)數(shù)據(jù)來判斷網(wǎng)站的降權(quán)情況,IP分析的更多用途是判斷是否存在采集蜘蛛、假蜘蛛、惡意點(diǎn)擊蜘蛛等,從而對那些訪問來源進(jìn)行屏蔽、禁止訪問處理,以節(jié)省帶寬資源及減輕服務(wù)器壓力,留給訪客及蜘蛛更好的訪問體驗(yàn)。