二、 計算視數(shù)據(jù)管理
數(shù)據(jù)處理的中心問題是數(shù)據(jù)管理。計算機對數(shù)據(jù)的管理是指如何對數(shù)據(jù)分類、組織、編碼、存儲,檢索和難護。
計算機在數(shù)據(jù)管理方面經(jīng)歷了由低級到高級的發(fā)展過程。計算機數(shù)據(jù)管理隨著計算機硬件、軟件技術(shù)和計算機應用范圍的發(fā)展而發(fā)展,先后經(jīng)歷了人工管理、文件系統(tǒng)和數(shù)據(jù)庫系統(tǒng)、分布式數(shù)據(jù)庫系統(tǒng)和面向?qū)ο髷?shù)據(jù)庫系統(tǒng)等幾個階段。
1.人工管理
20世紀50年代中期以前,計算機主要用于科學計算。當時的硬件狀況是,外存儲器只有紙帶、卡片、磁帶,沒有像磁盤這樣的可以隨機訪問、直接存取的外部存儲設備。軟件狀況是,沒有操作系統(tǒng),沒有專門管理數(shù)據(jù)的軟件,數(shù)據(jù)由計算或處理它的程序自行攜帶。數(shù)據(jù)管理任務,包括存儲結(jié)構(gòu)、存取方法、輸入/輸出方式等完全由程序設計人員自行負責。
這一時期計算機數(shù)據(jù)管理的特點是:數(shù)據(jù)與程序不具有獨立性,一組數(shù)據(jù)對應一組程序。數(shù)據(jù)不能長期保存,程序運行結(jié)束后就退出計算機系統(tǒng),一個程序中的數(shù)據(jù)無法被其它程序使用, 因此程序與程序之間存在大量的重復數(shù)據(jù),稱為數(shù)據(jù)冗余。
2.文件系統(tǒng)
20世紀50年代后期到60年代中期,計算機的應用范圍逐漸擴大,計算機不僅用于科學計算,而且還大量用于管理。這時可以直接存取的磁鼓、磁盤成為聯(lián)機的主要外部存儲設備;在軟件方面,出現(xiàn)了高級語言和操作系統(tǒng)。操作系統(tǒng)中已經(jīng)有了專門的數(shù)據(jù)管理軟件,稱為文件系統(tǒng)。
在文件系統(tǒng)階段,程序和數(shù)據(jù)有了一定的獨立性,程序和數(shù)據(jù)分開存儲,有了程序文件和數(shù)據(jù)文件的區(qū)別。數(shù)據(jù)文件可以長期保存在外存儲器上被多次存取。
在文件系統(tǒng)的支持下,程序只需用文件名就可以訪問數(shù)據(jù)文件,程序員可以將精力集中在數(shù)據(jù)處理的算法上,面不必關(guān)心記錄在存儲器上的地址和內(nèi)、外存交換數(shù)據(jù)的過程。
但是,文件系統(tǒng)中的數(shù)據(jù)文件是為了滿足特定業(yè)務領域,或某部門的專門需要而設計的,服務于某一特定應用程序,數(shù)據(jù)和程序相互依賴。同一數(shù)據(jù)項可能重復出現(xiàn)在多個文件中,導致數(shù)據(jù)冗余度大,這不僅浪費了存儲空間,增加了更新開銷,更嚴重的是,由于不能統(tǒng)一修改,容易造成數(shù)據(jù)的不-致。
文件系統(tǒng)存在的問題阻礙了數(shù)據(jù)處理技術(shù)的發(fā)展,不能滿足日益增長的信息需求,這正是數(shù)據(jù)庫技術(shù)產(chǎn)生的原動力,也是數(shù)據(jù)庫系統(tǒng)產(chǎn)生的背景。
3.數(shù)據(jù)庫系統(tǒng)
從20世紀60年代后期以來,計算機用于管理的規(guī)模更為龐大,應用越來越廣泛,需要計算機管理的數(shù)據(jù)量急劇增長,同時多種應用、多種語言互相覆蓋地共享數(shù)據(jù)集合的要求越來越強烈。這時硬件有大容量磁盤,硬件價格下降;軟件價格上升,為編制和維護系統(tǒng)軟件及應用程序所需的成本相對增加。在處理方式上,聯(lián)機實時處理要求更多,并開始提出和考慮分布處理。在這種背景下,以文件系統(tǒng)作為數(shù)據(jù)管理手段已經(jīng)不能滿足應用的需求,于是為解決多用戶、多應用共享數(shù)據(jù)的需求,使數(shù)據(jù)為盡可能多的應用提供服務,出現(xiàn)了數(shù)據(jù)庫技術(shù)和統(tǒng)一管理數(shù)據(jù)的專門軟件系統(tǒng)一一數(shù)據(jù)庫管理系統(tǒng)。
1968年美國IBM公司研制成功的數(shù)據(jù)庫管理系統(tǒng)IMS(Information Management System)標志著數(shù)據(jù)處理技術(shù)進人了數(shù)據(jù)庫系統(tǒng)階段。IMS是層次模型數(shù)據(jù)庫。1969年美國CODASYL(Conference on Data System Language,數(shù)據(jù)系統(tǒng)語言協(xié)會)委員會公布了DBTG報告,對研制開發(fā)網(wǎng)狀數(shù)據(jù)庫系統(tǒng)起到了推動作用。自1970年起,IBM公司的E.F.Godd連續(xù)發(fā)表論文,奠定了關(guān)系數(shù)據(jù)庫的理論基礎。目前關(guān)系數(shù)據(jù)庫系統(tǒng)巳逐漸淘汰了網(wǎng)狀數(shù)據(jù)庫和層次數(shù)據(jù)庫,成為當今最流行的商用數(shù)據(jù)庫系統(tǒng)。
數(shù)據(jù)庫技術(shù)的主要目的是有效地管理和存取大量的數(shù)據(jù)資源,包括:提商數(shù)據(jù)的共享性,使多個用戶能夠同時訪問數(shù)據(jù)庫中的數(shù)據(jù);減小數(shù)據(jù)的冗余,以提高數(shù)據(jù)的一致性和完整性;提供數(shù)據(jù)與應用程序的獨立性,從而減少應用程序的開發(fā)和維護代價。
為數(shù)據(jù)庫的建立、使用和維護而配置的軟件稱為數(shù)據(jù)庫管理系統(tǒng)(Data Base Management System,DBMS)。數(shù)據(jù)庫管理系統(tǒng)以操作系統(tǒng)提供的輸入/輸出控制和文件訪問功能為基礎,因此它需要在操作系統(tǒng)的支持下才能運行。
在數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)已經(jīng)成為多個用戶或應用程序共享的資源,已經(jīng)從應用程序中完全獨立出來,由DBMS統(tǒng)一管理。數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)與應用程序的關(guān)系如圖1.1所示。
相關(guān)推薦:
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |