更多:2011年軟考程序員考試復(fù)習(xí)筆試知識(shí)點(diǎn)整理匯總
13、B樹(shù)、B-樹(shù)、B+樹(shù)、B*樹(shù)、紅黑樹(shù)和trie樹(shù)
(1)B樹(shù):即二叉搜索樹(shù).
1.所有非葉子結(jié)點(diǎn)至多擁有兩個(gè)兒子(Left和Right);
2.所有結(jié)點(diǎn)各存儲(chǔ)一個(gè)關(guān)鍵字;
3.非葉子結(jié)點(diǎn)的左指針指向小于其關(guān)鍵字的子樹(shù),右指針指向大于其關(guān)鍵字的子樹(shù);
如:
B樹(shù)的搜索,從根結(jié)點(diǎn)開(kāi)始,如果查詢(xún)的關(guān)鍵字與結(jié)點(diǎn)的關(guān)鍵字相等,那么就命中;否則,如果查詢(xún)關(guān)鍵字比結(jié)點(diǎn)關(guān)鍵字小,就進(jìn)入左兒子;如果比結(jié)點(diǎn)關(guān)鍵字大,就進(jìn)入右兒子;如果左兒子或右兒子的指針為空,則報(bào)告找不到相應(yīng)的關(guān)鍵字;
如果B樹(shù)的所有非葉子結(jié)點(diǎn)的左右子樹(shù)的結(jié)點(diǎn)數(shù)目均保持差不多(平衡),那么B樹(shù)的搜索性能逼近二分查找;但它比連續(xù)內(nèi)存空間的二分查找的優(yōu)點(diǎn)是,改變B樹(shù)結(jié)構(gòu)(插入與刪除結(jié)點(diǎn))不需要移動(dòng)大段的內(nèi)存數(shù)據(jù),甚至通常是常數(shù)開(kāi)銷(xiāo);
如:
但B樹(shù)在經(jīng)過(guò)多次插入與刪除后,有可能導(dǎo)致不同的結(jié)構(gòu):
右邊也是一個(gè)B樹(shù),但它的搜索性能已經(jīng)是線性的了;同樣的關(guān)鍵字集合有可能導(dǎo)致不同的樹(shù)結(jié)構(gòu)索引;所以,使用B樹(shù)還要考慮盡可能讓B樹(shù)保持左圖的結(jié)構(gòu),和避免右圖的結(jié)構(gòu),也就是所謂的“平衡”問(wèn)題;
實(shí)際使用的B樹(shù)都是在原B樹(shù)的基礎(chǔ)上加上平衡算法,即“平衡二叉樹(shù)”;如何保持B樹(shù)結(jié)點(diǎn)分布均勻的平衡算法是平衡二叉樹(shù)的關(guān)鍵;平衡算法是一種在B樹(shù)中插入和刪除結(jié)點(diǎn)的策略;
(2)B-樹(shù)
是一種多路搜索樹(shù)(并不是二叉的), 多路平衡查找樹(shù):
1.定義任意非葉子結(jié)點(diǎn)最多只有M個(gè)兒子;且M>2;
2.根結(jié)點(diǎn)的兒子數(shù)為[2, M];
3.除根結(jié)點(diǎn)以外的非葉子結(jié)點(diǎn)的兒子數(shù)為[M/2, M];
4.每個(gè)結(jié)點(diǎn)存放至少M(fèi)/2-1(取上整)和至多M-1個(gè)關(guān)鍵字;(至少2個(gè)關(guān)鍵字)
5.非葉子結(jié)點(diǎn)的關(guān)鍵字個(gè)數(shù)=指向兒子的指針個(gè)數(shù)-1;
6.非葉子結(jié)點(diǎn)的關(guān)鍵字:K[1], K[2], …, K[M-1];且K[i] < K[i+1];
7.非葉子結(jié)點(diǎn)的指針:P[1], P[2], …, P[M];其中P[1]指向關(guān)鍵字小于K[1]的子樹(shù),P[M]指向關(guān)鍵字大于K[M-1]的子樹(shù),其它P[i]指向關(guān)鍵字屬于(K[i-1], K[i])的子樹(shù);
8.所有葉子結(jié)點(diǎn)位于同一層;
如:(M=3)
B-樹(shù)的搜索,從根結(jié)點(diǎn)開(kāi)始,對(duì)結(jié)點(diǎn)內(nèi)的關(guān)鍵字(有序)序列進(jìn)行二分查找,如果命中則結(jié)束,否則進(jìn)入查詢(xún)關(guān)鍵字所屬范圍的兒子結(jié)點(diǎn);重復(fù),直到所對(duì)應(yīng)的兒子指針為空,或已經(jīng)是葉子結(jié)點(diǎn);
B-樹(shù)的特性:
1.關(guān)鍵字集合分布在整顆樹(shù)中;
2.任何一個(gè)關(guān)鍵字出現(xiàn)且只出現(xiàn)在一個(gè)結(jié)點(diǎn)中;
3.搜索有可能在非葉子結(jié)點(diǎn)結(jié)束;
4.其搜索性能等價(jià)于在關(guān)鍵字全集內(nèi)做一次二分查找;
5.自動(dòng)層次控制;
由于限制了除根結(jié)點(diǎn)以外的非葉子結(jié)點(diǎn),至少含有M/2個(gè)兒子,確保了結(jié)點(diǎn)的至少利用率,其最底搜索性能為:
其中,M為設(shè)定的非葉子結(jié)點(diǎn)最多子樹(shù)個(gè)數(shù),N為關(guān)鍵字總數(shù);
所以B-樹(shù)的性能總是等價(jià)于二分查找(與M值無(wú)關(guān)),也就沒(méi)有B樹(shù)平衡的問(wèn)題;
由于M/2的限制,在插入結(jié)點(diǎn)時(shí),如果結(jié)點(diǎn)已滿(mǎn),需要將結(jié)點(diǎn)分裂為兩個(gè)各占M/2的結(jié)點(diǎn);刪除結(jié)點(diǎn)時(shí),需將兩個(gè)不足M/2的兄弟結(jié)點(diǎn)合并;
相關(guān)推薦:北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |