亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

O探討:網頁信噪比我之見
2007-01-18   Admin5

關于信噪比的定義,網上廣泛流傳的定義是:指網頁中的文本內容部分與生成這些文本而產生的html標簽內容的比率;小鵬認為應該更廣義的理解是:網頁中的文本以及各種因素(包括圖片,flssh,css等鏈接 )和網頁html標簽內容的比率.

那么針對上面這兩種定義,我還是認為非常的不恰當,沒有抓住本質的東西.不管是聲學方面對于信噪比的定義還是數據通信領域里的信噪比,在定義概念的時候,都強調了有用信息跟干擾信息之間的比較.比如數據通信領域對于信噪比(S/N)的定義就是信息與噪聲之比。那么類比到搜索引擎檢索領域,網頁內容信噪比的定義應該依然是網頁有用信息跟干擾信息之比。

 以有用信息跟干擾信息之比這種定義來看,之前提到的兩種定義,都認為網頁中的文本(或加上其他因素如包括圖片,flssh,css等)成了有用信息,而產生的html標簽內容減去這些有用信息的為垃圾信息。這顯然太過于牽強。難道搜索引擎能識別的文本信息就一定是有用信息???而之外的其他信息就是干擾信息?

 所以理解信噪比的關鍵就在于什么是有用信息,什么是干擾信息。

 而對于這一點,我理解的是:搜索引擎對于其所抓取的內容會有一個基本的判斷,判斷該頁面內容對應的主題及所有可能的關鍵詞并將其進行排序。是否為有用信息和無用信息,對于搜索引擎來說,是針對具體關鍵詞而言的。所以網頁的信噪比跟具體某一關鍵詞的信噪比應該有所區分。具體關鍵字的信噪比是網頁中對該關鍵字檢索有利的信息和干擾信息之比。而網頁的信噪比為該頁面核心關鍵字的信噪比。

網頁中如果存在搜索引擎認為與某一搜索詞沒有任何相關性的內容(即搜索引擎無法判斷該段內容與搜索關鍵詞之間的關系),那么這些內容既為該關鍵詞的干擾信息。這些干擾信息可能包括flash,圖片,及與關鍵詞沒有相關、卻十分冗長的段落文本等。同理,網頁的干擾信息即為網頁核心關鍵詞的干擾信息。

  對于flash,圖片,js等搜索引擎不能識別的東西來說,對于任何關鍵詞都被列入了干擾信息。而且,對于文字內容比較多的站點來說,信噪比跟關鍵詞密度的概念比較接近。至于具體的html的代碼語句符號,我覺得對于搜索引擎來說,其對于網站排名的影響,更多是影響了網站代碼的合理和正確性,影響了網站的訪問速度。而不是被搜索引擎列為干擾信息,影響排名的。所以,我也可以預言,如果多余的代碼不是太過分,導致網頁出錯或不符合某些標準或使得網頁文件太大。對排名的影響幾乎是可以不考慮的。一般情況下,搜索引擎都直接忽略了這些代碼符號語句,也從來沒有在哪個搜索引擎的搜索結果中看到html里面的那些語句定義符號出現過。

  上面所討論的信噪比概念,體現在具體搜索引擎優化操作中,就是需重視網頁核心關鍵詞的信噪比,而不可能考慮所有可能關鍵詞的信噪比。對于一個比較合理的站點來說,搜索引擎可以通過網站的Title,Meta等去識別網頁的核心主題,那么網頁的段落中出現與Title和Meta相呼應的內容就非常重要,這些內容可能會列為有用信息,那么其他的一些信息,雖然也是文本,但如果冗長而與標題Meta不相關,就應該果斷舍棄,或使其相關。不然則直接增加了網站核心關鍵詞的信噪比。

還有一個需要注意的是,設計網頁需要考慮如何讓搜索引擎識別核心關鍵詞和主題。如果搜索引擎連主題都很難理解,那么談網頁信噪比也沒有意義。具體如何讓搜索引擎識別核心關鍵詞和主題,則是另一個話題,擇日再論。 當然本文的想法嘗未經實踐證明,提出來引導大家思考而已。

熱詞搜索:

上一篇:網頁信噪比的一點研究
下一篇:9種常見的spam的方式

分享到: 收藏