上網行為管理產品具有URL(或網址)過濾的功能,企業可以使用上網行為管理設備過濾與工作無關的網站,從而規范員工上網行為,提高工作效率。但很多用戶在使用RUL過濾功能時容易產生困惑,如為什么已經設置了對指定URL(或網址)的過濾規則,該URL(或網址)還可以打開?本文將從URL過濾功能的實現原理出發解答這些問題,并介紹不同需求條件下的URL過濾規則設置技巧。
URL定義
Uniform Resource Locator即“統一資源定位符”,也被稱為“網頁地址”,是因特網上標準資源的地址。URL的一般格式是:“協議://主機/路徑/文件名.文件后綴”。URL 是對可以從因特網上得到的資源的位置和訪問方法的一種簡潔的表示,相當于一個文件名在網絡范圍的擴展。因此URL是與因特網相連的機器上的任何可訪問對象的一個指針。例如:http://baike.baidu.com/view/1321789.htm代表baike.baidu.com這臺主機view路徑下的1321789.htm文件,其通信協議為http(超文本傳輸協議)。
URL過濾原理
上網行為管理產品對URL的過濾通常是指針對HTTP協議URL的過濾。下面我們還是以訪問“http://baike.baidu.com/view/1321789.htm”為例講解URL過濾的原理:當我們瀏覽“http://baike.baidu.com/view/1321789.htm”這個網址的同時運行抓包軟件,將會捕獲到下圖所示的報文:
捕獲的URL訪問報文
分析上述報文可以看出當主機訪問網站時,首先會發送一個HTTP請求報文,該報文指明了應用層協議為HTTP,操作方法為GET,URL字段內容(路徑及文件名)為“/view/1321789.htm”,HOST字段內容為“baike.baidu.com”。當一個http報文經過上網行為管理設備時,設備可以識別出上述信息,并進一步檢查報文中的HOST和URL字段內容,如果HOST或URL字段內容中有字符串與URL過濾規則中定義的過濾關鍵字相匹配,那么該報文將會被丟棄,用戶電腦與該網站服務器的連接斷開,從而無法打開該網頁。
實用案例
案例一:為什么已經設置了過濾 “http://www.163.com”網址關鍵字,網易主頁卻還是能打開?
上面已經說過上網行為管理設備在進行URL過濾時檢查的是HTTP報文中HOST和URL字段的內容,從上述抓包信息分析可知“http://”字符串并不會出現在這兩個字段中。因此,設備無法在訪問網易網站的HTTP報文的HOST及RUL字段中匹配到“http://www.163.com”這個字符串,正確的過濾關鍵字應該為“www.163.com”。
案例二:我想過濾網易郵箱,但不想過濾網易主頁和其他網易子鏈接,如何設置?
由于網易郵箱的HOST字段為mail.163.com,設置過濾關鍵字為“mail.163.com”即可以達到效果。而訪問網易主頁時HTTP報文中的HOST字段為www.163.com,不會匹配過濾規則定義的“mail.163.com”關鍵字,因此訪問網易主頁不會被過濾。
案例三:我想過濾所有與網易有關的網頁,并已經設置了“www.163.com”過濾關鍵字,為什么只有網易主頁打不開,網易郵箱和網易新聞卻還能打開?
很顯然由上述兩案例我們已經知道“www.163.com”是網易主頁的HOST字段內容。而網易郵箱是“mail.163.com”,網易新聞是“news.163.com”,因此無法完全匹配“www.163.com”過濾關鍵字,也就達不到過濾它們的效果。想達到這個效果其實很簡單,設置關鍵字為“163.com”即可。因為與網易有關的網頁其HOST字段都會包含“163.com”字符。
本文作者為百卓網絡高級技術支持工程師王嘯巖,欲了解更多關于百卓網絡上網行為管理產品的信息請訪問www.byzoro.com。