站長問:百度對使用海外空間的中文網(wǎng)站有歧視嗎?百度是否會抓取域名注冊人的相關(guān) whois 信息?
百度工程師答:1、百度對海外站點沒有歧視。但百度從國內(nèi)爬出去的蜘蛛,會嚴格遵守國家的政策和法令,所以國內(nèi)普通用戶訪問受限的內(nèi)容,百度蜘蛛一樣會搞不定。
2、任何對站點價值分析有貢獻的要素,都有可能被搜索引擎使用。并且這些要素的使用方式,也不是一成不變的。至于具體有哪些要素已經(jīng)被使用以及如何使用,這個無法詳述。
站長問:一般來說,網(wǎng)站所有者不是太希望 https 的網(wǎng)頁被收錄。如果收錄了,如果處理?把 https 的網(wǎng)頁 URL 更換成 http 形式的?還有一種情況,就是 ip 地址形式的URL被收錄。
百度工程師答:如果不希望被收錄,常規(guī)的做法是設(shè)置 robots 文件。https 主要的出發(fā)點是安全,并沒有太多考慮搜索引擎。從用戶角度,很多采用了 https 的站點(尤其是首頁),也是需要被搜索到的,比如支付寶,貝寶等。通常情況下,搜索引擎對這類網(wǎng)頁并不做內(nèi)容解析,而只是將 URL 進行索引。IP 地址的 URL 被收錄,除了 spider 在機制上的不完善之外,通常站點設(shè)計上也有一些缺陷。一般情況下,這類問題是可以被規(guī)避的。
站長問:百度數(shù)據(jù)更新的周期大概是多長?
百度工程師答:如果是一個變化頻繁的入口索引頁面,相信這個變化周期會很短;而是相對穩(wěn)固的內(nèi)容型頁面,周期則會相對較長。站長們觀察一下蜘蛛的爬取日志,發(fā)現(xiàn)的規(guī)律會比這邊的說明更有價值。此外,搜索結(jié)果頁上的那個時間,一直很讓人confusing,我們正在考慮修改。
站長問:百度對子域名如 news.domain.com 和主域名 www.domain.com 權(quán)重怎么處理?是當(dāng)作兩個不同的網(wǎng)站還是子域名會繼承主域名的權(quán)重?
百度工程師答:怎樣處理是合乎邏輯的,策略上就會采用那個合乎常理的處理手段?;蛘哌@樣講,如果你是負責(zé)這個權(quán)重處理的,你覺得怎樣做是最合理的?那么很可能百度就是如你所想的。呵呵。搜索引擎理解起來并不復(fù)雜,站在用戶角度考量,很容易揣摩搜索引擎的策略思路。
站長問:目前刷百度相關(guān)搜索和搜索下拉框的方法很多,怎樣才能限制或者根除這種現(xiàn)象。有沒有像投訴平臺這樣的地方,可以讓大家投訴,給大家一個更好的相關(guān)搜索?
百度工程師答:這個問題的確很惱人。目前我們正在全力處理中,可預(yù)期將有大幅改觀。投訴可以發(fā)送到 webmaster@baidu.com,肯定可以送達相關(guān)工程師,但不會有具體的回復(fù)。此外,處理多半是策略級的升級,個案的針對性處理會比較少
站長問:Google 有 PR 指數(shù),搜狗有指數(shù),百度有什么?或許百度已經(jīng)有對網(wǎng)頁進行質(zhì)量評分了,暫時沒有對外開放?以后會有這樣的網(wǎng)頁評級指數(shù)么?
百度工程師答:多公布一個評級指數(shù),只是為站長們多帶來一分煩惱。事實上,很少有成熟的搜索引擎會發(fā)布用于最終質(zhì)量評級的指數(shù)。按照 Google 的官方說法,PR 也只是諸多排序因子中的一個而已。