亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關(guān)注微信公眾號

理解SQL Server2008索引的存儲結(jié)構(gòu)
2010-02-22   網(wǎng)絡(luò)

索引結(jié)構(gòu)被分為兩類索引組件:葉級(leaf level)和非葉級(non-leaf Level(s)) 。

一個聚集索引的葉級包含索引鍵和數(shù)據(jù)。“聚集索引的葉級除了鍵值還有什么?”答案是“其他的任何東東(everything else)”。也就是說,表中的所有行的列都在一個聚集索引的葉級中。換種說法是:當(dāng)一個聚集索引被創(chuàng)建的時候,數(shù)據(jù)(data)變成了聚集索引的葉級, 同 時,表中的數(shù)據(jù)被聚集鍵復(fù)制和排序。一旦被創(chuàng)建,一個聚集索引被邏輯維護(hù)而不是物理維護(hù),排序被通過一個雙鏈列表(稱為頁鏈page Chain)維護(hù)。(注意:在一個堆(Heap)中頁是不會有任何方式互相鏈接的。 )在頁鏈中的頁的排序和數(shù)據(jù)頁中行的排序,均是基于聚集 索引的定義。決定哪些列用于索引是一個重要的性能參考指標(biāo)。

由于數(shù)據(jù)頁的實(shí)際頁鏈只能被一種方式排序,所以一個表只能有一個聚集索引。而且,通常情況下,大多數(shù)在使用聚集索引的時候性能更佳。然而,聚集鍵需 要被慎重選擇,為了適當(dāng)選擇索引鍵,你必須理解索引是如何工作的。即聚集鍵的內(nèi)部依賴,特別是非聚集索引。

位于聚集鍵上的非聚集索引的依賴(dependency)在SQL Server 7.0時代存儲引擎被重新架構(gòu)時就已經(jīng)存在了,它最初是用于(當(dāng)使用一個非聚集索引去引用表中相應(yīng)的行時)行如何被標(biāo)識。如果一個表有聚集索引,行被聚集 鍵標(biāo)記(和查找)。如果沒有聚集索引,則行被物理行標(biāo)識(identifier RID)標(biāo)記(和查找)。查找相應(yīng)的數(shù)據(jù)行的處理就好像查找書的書簽。

非聚集索引僅僅包含索引定義的數(shù)據(jù) 。當(dāng)在一個非聚集索引中查找一行的時候,你通常不得不到實(shí)際的數(shù)據(jù)行以得到?jīng)]有包含在非聚集索引部 分的數(shù)據(jù)。為了檢索這部分附加數(shù)據(jù),你必須深入表的內(nèi)部。

首先 ,最重要的是,所有聚集索引必須是惟一的。為什么必須是惟一的首要原因是非聚集索引項(xiàng)能夠準(zhǔn)確地指向一個特定的行。考慮到如果一 個表被最后一個名字(last name)的不惟一的值聚集,問題來了。如果一個非聚集索引存在于一個惟一的值,比如社會安全號(對我們而言就是身份證號),一個查詢社會安全號為 123-45-6789的索引,結(jié)果,聚集鍵是“Smith”,那么多個最后名字為Smith的行出現(xiàn),到底是哪個?這個社會安全號為 123-45-6789的特定行,如何被有效定位?

為了聚集鍵能被有效使用,所有非聚集索引項(xiàng)必須準(zhǔn)確地指向一行。因?yàn)镾QL Server中的指針是聚集索引,所以,聚集索引必須是惟一的。如果你創(chuàng)建一個聚集索引時沒有使用Unique關(guān)鍵字,系統(tǒng)在必要時會自動向這些行添加一 個惟一標(biāo)志列以確保內(nèi)部的惟一性。這個惟一標(biāo)志(uniquifier)是一個4字節(jié)的整數(shù),當(dāng)行的聚集鍵不惟一時,自動被回到數(shù)據(jù)行,一旦被添加,它變 成了聚集鍵的一部分,意味著它在每一個非聚集索引中被復(fù)制。 

第二 ,如果一個聚集鍵(Clustering key)被用于從一個非聚集索引到一個聚集索引的(數(shù)據(jù))內(nèi)部查找相應(yīng)的數(shù)據(jù)行,那么,這個聚集鍵是表中最被過多使用的數(shù)據(jù)。所有列都組織索引鍵,這些 鍵被包含于每一個非聚集索引附加于實(shí)際數(shù)據(jù)行中。結(jié)果,索引鍵的寬度變得重要了。考慮一個擁有12個非聚集索引和一百萬數(shù)據(jù)的表的一個聚集索引擁有64字 節(jié)的聚集健。不計(jì)算內(nèi)部和結(jié)構(gòu)頭部,僅僅用于存儲在每一個非聚集索引鍵的索引鍵將是732MB,而如果聚集鍵只有8字節(jié)的話,這開銷是92MB,而如果4 字節(jié)的話,將只有46MB。盡管這只是一個粗略的估計(jì),它表明如果你使用了一個過寬的聚集鍵,將浪費(fèi)大量的空間(以及潛在的緩 存池內(nèi)存),性能的損耗是比較可觀的。因此,一個過寬的非聚集索引是應(yīng)該避免的。

第三,因?yàn)榫奂饕I是整個表中最冗余的數(shù)據(jù),你應(yīng)該確信你的聚集鍵是不易變的(not volatile),如果一個聚集健改變,它有以下幾個副作用:1、它會引起聚集索引內(nèi)的記錄的搬遷,造成頁page的分離與碎片。2、它引起每一個非聚 集索引被修改,以便于所有相關(guān)的非聚集索引的行的索引鍵的值被糾正。這既浪費(fèi)時間和空間,導(dǎo)致需要整理的碎片,增加了不必要的開銷(每個列重組聚集鍵)。

這三個屬性:惟一、窄和靜態(tài)也被用一個好的主鍵(但不總是)。因?yàn)槟阒挥幸粋€主鍵(僅僅一個聚集鍵)。SQL Server使用一個惟一的聚集索引以強(qiáng)化主鍵約束。然而,并不是每一個表的創(chuàng)建者(唉,別睡著了,說你呢!)都知道這一點(diǎn)。于是,主鍵沒有被堅(jiān)持這些標(biāo) 準(zhǔn)(舉例,當(dāng)主鍵被選為數(shù)據(jù)的自然健(natural key),即,如一個寬的7個列的100個字節(jié)組合),那么使用一個聚集索引去強(qiáng)化惟一性,并在每一個非聚集索引復(fù)制完全的100字節(jié)的列組合將具有極強(qiáng) 的反作用。l因此,對一些不知情的(unsuspecting)數(shù)據(jù)庫開發(fā)人員(具體就是剛才睡覺的那幾位),一個非常寬的聚集健在創(chuàng)建表時就被系統(tǒng)不知 不覺的加上了,好消息是:你可以定義主鍵是非聚集索引,并且輕易地在一個不同的列上創(chuàng)建一個聚集索引 。當(dāng)然,你必須知道什么時候和怎樣做這 些。

最后,一個表的聚集鍵也應(yīng)當(dāng)以Insert時產(chǎn)生最小碎片為依據(jù)。盡管一旦聚集索引被創(chuàng)建后只有一個邏輯排序被維護(hù),這個結(jié)構(gòu)的維護(hù)確實(shí)有開銷。如 果行需要持續(xù)地被插入在隨機(jī)點(diǎn)(如插入一個以last name排序的表中),那么這個表的邏輯排序的維護(hù)成本比總是插入一個以自增長列排序的表(總是在表的末尾處)略微有些提高。

小結(jié):表的聚集鍵應(yīng)該基于表的用途,同時也應(yīng)當(dāng)基于SQL Server在聚集健的內(nèi)部依賴。聚集鍵應(yīng)該是惟一的、窄的、靜態(tài)的,最好,不斷增長?( ever-increasing)。

好的聚集鍵的例子如下:

◆單個列鍵被定義為一個不斷增長的自增長列(如int 或bigint)

◆一個不斷增長的日期列(date而不是datetime),緊跟著一個惟一的行標(biāo)識(如自增長列)組成一個復(fù)合鍵,這對基于日期分區(qū)的表非常有 用。如SalesDate(8字 節(jié))+SalesNumber(4字節(jié))組合為12字節(jié),注意在SQL Server 2008中,一個日期列(date)不包含時間。但是單獨(dú)的一個日期列(date)并不是一個好的聚集鍵,因?yàn)樗晃┮弧?/p>

◆一個GUID能被成功地用作一個聚集鍵,因?yàn)樗旧砭褪俏┮坏摹O鄬Φ恼?12字節(jié)),可能是靜態(tài)的。然而,僅僅在不斷增長的模式下,GUID 才適合被用作聚集健。在一些情況下,GUID是在SQL Server的外部被生成或在SQL Server內(nèi)部用 NieID()生成,這種模式下產(chǎn)生的碎片抵消了這個列作為聚集健的作用。如果可能,請選擇NEWSEQUENTIALID()函數(shù)或選擇其他列。如果你 想用GUID作為一個主鍵,并且不是自增長的,你可以把這個列作為一個非聚集索引代替聚集索引。

總之,沒有一個通用的最好的絕對有效的法則來決定一個聚集鍵的選擇。然而,一個表如果只有一個索引,并且是非聚集索引,那么在聚集健上的非聚集索引 依賴將不再相關(guān)。如果是聚集索引,可以采取任何形式。幸運(yùn)的是,大多數(shù)表有一個以上的非聚集索引,大多數(shù)的表有一個聚集索引性能更佳。因此,第一步:精心 選擇聚集鍵,第二步,查找一個正確的平衡,選擇適當(dāng)?shù)模钚?shù)量的非聚集索引。

非聚集索引 (NonClustering Indexes)

正如前面所述,所有索引中有兩類主要組件:葉級(leaf level)和非葉級(non-leaf Level(s)) 。一個聚集索引的葉級就是數(shù)據(jù)。一個非聚集索引葉級是一個獨(dú)立的、額外的結(jié)構(gòu)(一些數(shù)據(jù)的copy),特別地,一個非聚集索引取決于它的葉級形式的定義, 非聚集索引由索引鍵,任何包含性列、數(shù)據(jù)行的書簽(bookmark)值,,一個蜚聚集索引的數(shù)量跟表中的數(shù)據(jù)行一樣多,除非索引定義時使用了過濾謂詞 (Filter predicate)。過濾謂詞在SQl Server 2008是新增的。

非聚集索引的工作方式有兩種:

1、輔助指向數(shù)據(jù)或直接回答查詢。當(dāng)一個非聚集索引擁有查詢中請求的全部數(shù)據(jù)時,這就是所謂的“查詢覆蓋(query covering)”,這時索引被稱為覆蓋索引,此時,非聚集索引被用于直接回答查詢而避免了書簽查詢(bookmark lookup),一種對于非聚集索引異常昂貴的查詢。

2、當(dāng)一個非聚集索引沒有包含查詢中請求的全部數(shù)據(jù)時,這個查詢被一個索引能找到的謂詞驅(qū)動,此時,書簽查詢發(fā)生。如果一個表有一個聚集索引,非聚 集索引被用于驅(qū)動查詢?nèi)ネㄟ^聚集鍵找到相應(yīng)的數(shù)據(jù)行。如果是Heap(沒有聚集索引),查詢值是一個8字節(jié)的RID,實(shí)際行位置如下格式 FileID:PageID:SlotNumber。這個8字節(jié)值:2字節(jié):4字節(jié):2字節(jié)。后面還有深入了解。

非聚集索引的設(shè)置與否并不會影響數(shù)據(jù)頁被組織。SQL Server 2008中,一個表中可以有999個非聚集索引。SQL Server 2005中是249個。實(shí)際使用環(huán)境中,你盡可能少數(shù)量的使用(因?yàn)橐恍╁e誤,比如Filtered Indexes)。

總而言之,非聚集索引不會影響基表,相反,基表的結(jié)構(gòu)會影響非聚集索引的結(jié)構(gòu)。如果你想減少開銷和架構(gòu)最佳性能,你最好理解這些。

約束和索引(Constaits and Indexes)

有關(guān)Primary Key約束和UNIQUE 約束,請查看MSDN:

http://msdn.microsoft.com/zh-cn/library/ms191236.aspx

http://msdn.microsoft.com/zh-cn/library/ms191166.aspx

一個基本的區(qū)別是后者可以是NUll,前者不允許NUll,兩者都不允許重復(fù)。

Indexes Creation Options

CREATE INDEX命令的更多選項(xiàng),請查看MSDN:

http://msdn.microsoft.com/zh-cn/library/ms188783.aspx

熱詞搜索:

上一篇:實(shí)戰(zhàn)詳解Oracle數(shù)據(jù)庫優(yōu)化方案與實(shí)踐
下一篇:SQL Server的分析服務(wù)性能優(yōu)化淺析

分享到: 收藏