Apache下網(wǎng)站日志里面顯示百度蜘蛛(Baiduspider)等的方法
網(wǎng)站的優(yōu)化工作很重要的一個(gè)環(huán)節(jié)就是要讓搜索引擎蜘蛛到網(wǎng)站上來(lái)抓取內(nèi)容,如果搜索引擎蜘蛛都不來(lái)網(wǎng)站,那網(wǎng)站的內(nèi)容再多在豐富也是沒(méi)有用的。
整個(gè)互聯(lián)網(wǎng)形如一張網(wǎng),搜索引擎的抓取程序就是通過(guò)這些一個(gè)一個(gè)的連接來(lái)抓取頁(yè)面內(nèi)容的,所以搜索引擎被形象的叫做蜘蛛或網(wǎng)絡(luò)爬蟲(chóng)。網(wǎng)絡(luò)爬蟲(chóng)是搜索引擎的一個(gè)自動(dòng)的抓取頁(yè)面的程序。搜索引擎蜘蛛通過(guò)跟蹤連接訪(fǎng)問(wèn)頁(yè)面。獲得頁(yè)面HTML代碼存入數(shù)據(jù)庫(kù)。爬行和抓取是搜索引擎工作的第一步,也就是數(shù)據(jù)收集的任務(wù)。然后就是預(yù)處理以及根據(jù)算法排名。
對(duì)于站長(zhǎng)來(lái)說(shuō),網(wǎng)站的第一步就是解決收錄問(wèn)題,我們每天都在更新,可有時(shí)就是不收錄。我們要想得到收錄和蜘蛛的青睞,你就要懂得蜘蛛的爬行原理和規(guī)律。要學(xué)習(xí)和研究蜘蛛爬行規(guī)律,分析網(wǎng)站的訪(fǎng)問(wèn)日志是重要的一項(xiàng)工作。下面我們來(lái)介紹如何查看網(wǎng)站的訪(fǎng)問(wèn)日志。
針對(duì)WDCP面板 設(shè)置Apache日志記錄蜘蛛爬行
1、首頁(yè),你要在 “站點(diǎn)編輯” 里面把 "開(kāi)啟訪(fǎng)問(wèn)日志 " 這個(gè)選項(xiàng)打勾
2、配置vhost 里面對(duì)應(yīng)站點(diǎn)的 conf 文件( /www/wdlinux/apache/conf/vhost)
把 CustomLog "/www/web_logs/你的域名_access_log" common 這一行的? common 修改成 combined
也就是修改成 CustomLog "/www/web_logs/你的域名_access_log" combined
修改完后保存一下。
3、請(qǐng)確認(rèn)CustomLog沒(méi)有被#號(hào)注釋掉,把 /www/wdlinux/apache/conf/httpd.conf? 這個(gè)文件也改一下
把 #CustomLog "logs/access_log" combined? 這一句前面的 # 去掉,然后再重啟web服務(wù)
4、重新啟動(dòng)web服務(wù),測(cè)試一下效果
好了,以上操作應(yīng)該是可以實(shí)現(xiàn)效果了,希望大家都可以操作成功
特別提醒,針對(duì)WDCP面板,如果在站點(diǎn)設(shè)置里面修改了其他設(shè)置,保存之后站點(diǎn)對(duì)應(yīng)的conf配置文件會(huì)自動(dòng)覆蓋掉?;蛘唿c(diǎn)擊了“更新所有站 點(diǎn)配置”,對(duì)應(yīng)的conf配置文件也會(huì)覆蓋掉你手動(dòng)添加的代碼。到時(shí)候默認(rèn)的設(shè)置還會(huì)是:CustomLog "/www/web_logs/你的域名_access_log" common,然后又得去手動(dòng)改一下。我找到一個(gè)完美解決的辦法,其他地方都不要?jiǎng)?,也不用去修改站點(diǎn)的conf配置文件。
直接修改apache默認(rèn)的httpd.conf配置文件。打開(kāi)/www/wdlinux/apache/conf/httpd.conf。找到:
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
LogFormat "%h %l %u %t \"%r\" %>s %b" common
把common和combined交換一下就行了,最終的代碼:
LogFormat "%h %l %u %t \"%r\" %>s %b" combined
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" common
上傳后重啟一下web服務(wù)就可以了。
原理就是在“站點(diǎn)編輯” 里面 "開(kāi)啟訪(fǎng)問(wèn)日志"后,默認(rèn)是添加的CustomLog "/www/web_logs/你的域名_access_log" common 這段代碼,生效的就是httpd.conf里面common的配置,改一下默認(rèn)的common的配置就OK了。
針對(duì)單個(gè)主機(jī)的配置方案 設(shè)置Apache日志記錄蜘蛛爬行
1、打開(kāi)httpd.conf文件找到以下部分:LogFormat
“%h %l %u %t \”%r\” %>s %b \”%{Referer}i\” \”%{User-Agent}i\”" combined
LogFormat
“%h %l %u %t \”%r\” %>s %b” common
LogFormat
“%{Referer}i -> %U” referer
LogFormat
“%{User-agent}i” agent
具體有關(guān)LogFormat的用法請(qǐng)參照:
2、接著我們繼續(xù)向下移動(dòng),找到虛擬主機(jī)配置段,也就是VirtualHost段,這個(gè)是由你自己來(lái)配置的。本站的虛擬主機(jī)的日志文件是這樣設(shè)置的:如果你想記錄百度蜘蛛的訪(fǎng)問(wèn)全稱(chēng),就按色部分設(shè)置:
CustomLog
/var/html/faq/logs/linux520-access.log combined
如果不想記錄百度蜘蛛的頭部分,則如下設(shè)置:
CustomLog
/var/html/faq/logs/linux520-access.log common
按照以上設(shè)置一下,看看你的日志文件是否發(fā)生變化了。
相關(guān)內(nèi)容推薦
- 網(wǎng)站建設(shè)穩(wěn)定提升網(wǎng)站流量是成功之源
- 【網(wǎng)站優(yōu)化】精心呵護(hù)的網(wǎng)站降權(quán)了怎么辦?
- 青島網(wǎng)站建設(shè):響應(yīng)式網(wǎng)站設(shè)計(jì)會(huì)成為未來(lái)趨勢(shì)
- 如何通過(guò)站外seo優(yōu)化快速提高網(wǎng)站的排名
- 青島網(wǎng)站優(yōu)化之利用爬蟲(chóng)技術(shù)檢測(cè)網(wǎng)頁(yè)
- 青島網(wǎng)站建設(shè)的三步流程詳解
- 網(wǎng)站開(kāi)發(fā)工具有哪些
- 域名如何實(shí)名認(rèn)證
- 青島網(wǎng)站建設(shè)哪家好?
- 著陸頁(yè)AB測(cè)試--SEO優(yōu)化不能想當(dāng)然
最新文章
更多>>- 什么是SEO優(yōu)化?SEO優(yōu)化怎么做?
- 營(yíng)銷(xiāo)型網(wǎng)站制作
- 網(wǎng)站優(yōu)化:寵物網(wǎng)站如何優(yōu)化?
- 網(wǎng)站建設(shè)及網(wǎng)站建設(shè)費(fèi)用-為您提供專(zhuān)業(yè)的網(wǎng)站建設(shè)服務(wù)
- 網(wǎng)站建設(shè)是什么?怎么做網(wǎng)站建設(shè)
- 網(wǎng)站建設(shè)為什么要分高端網(wǎng)站建設(shè)和普通網(wǎng)站建設(shè)
- 醫(yī)療健康科普問(wèn)答平臺(tái)系統(tǒng)介紹
- 抖音小程序如何開(kāi)發(fā)?
- 公司小程序建設(shè)和公司小程序開(kāi)發(fā)都需要哪些過(guò)程?
- 網(wǎng)站策劃在網(wǎng)站建設(shè)中的重要性
0532-88983785 / 0532-68613670
我要優(yōu)化網(wǎng)站