數字檔案室基礎設施建設丨基礎軟件
以下內容來源 《數字檔案室建設概論》,僅供參考、學習
基礎軟件又可稱為系統軟件,是指控制和協調計算機及外部設備,支持應用軟件開發和運行的系統,是無需用戶干預的各種程序的集合?;A軟件的主要功能是調度、監控和維護計算機系統,負責管理計算機系統中各種獨立的硬件,使得它們可以協調工作;支持、配合應用系統的開發,以實現必要的業務流程與功能,提高開發效率,降低每一次開發難度,實現各種軟件功能的共享與聯合。系統軟件使得計算機使用者、應用系統用戶和其他軟件將計算機當作一個整體而不需要顧及到底層每個硬件是如何工作的?;A軟件可分為操作系統、數據庫管理系統、中間件、語言處理程序和輔助程序等多種類別。
一、操作系統
眾所周知,操作系統是管理和控制計算機硬件與軟件資源的計算機程序,是直接運行在“裸機”上的最基本的系統軟件,任何其他軟件都必須在操作系統的支持下才能運行。操作系統可以分為網絡操作系統和桌面操作系統,前者適用于服務器領域,后者應用于PC機、筆記本電腦等設備之中。
當前主流的操作系統包含Unix、 Linux、微軟 Windows三大系列。目前,微軟 Windows仍然是使用最多的操作系統,在桌面終端上幾乎處于壟斷地位。服務器操作系統則有更多的選擇,可以根據服務器需承載的應用確定操作系統類型。從整體看,Linuⅹ操作系統有著很好的穩定性和適用性,中科麒麟、紅旗等國產linux操作系統具有優良的性能,可應用于Web服務器、數據庫服務器。
二、數據庫管理系統
數據庫管理系統( Database Management System,DBMS)是一種能夠操縱和管理數據庫的基礎軟件,可用于建立、使用、控制和維護數據庫,是數字檔案室必備的核心基礎軟件。數字檔案室應用系統通過DBMS訪問數據庫中的元數據以及元數據指向的數字檔案資源,數據庫管理員也通過DBMS進行數據庫的維護工作。數據庫可以分為關系型數據庫和非關系型數據庫兩類。關系型數據庫具有容易理解、使用方便、易于維護等優點,是數字檔案室的主選產品,其性能完全能夠滿足數字檔案資源管理要求。主流的國產關系型數據庫有達夢數據庫、南大通用數據庫等,國外產品有 Oracle、 MYSQL、 SQLserver和DB2等,其中, MYSQL為開源免費數據庫管理系統,性能良好。本單位在電子政務建設過程中已經配備了關系型數據庫管理系統的,在確認性能足夠的基礎上,可以統籌考慮、資源共享,依托已有數據庫管理系統建設數字檔案室應用系統。
三、全文檢索軟件
全文檢索軟件又稱全文搜索引擎,是目前廣泛應用的主流搜索引擎。全文檢索軟件的應用可以極大提高數字檔案資源檢索效率和查全率、查準率。簡單地說,全文檢索工作原理是通過計算機索引程序掃描數據中的每一個詞,對每一個詞建立一個索引,指明該詞在數據中出現的次數和位置,全文檢索系統會根據用戶提交的査詢要求在索引中查找,并將查找的結果反饋給用戶。這個過程類似于通過字典中的檢索字表查字的過程。一般來說,全文檢索軟件需要具備建立索引和提供査詢等基本功能,以及方便的用戶接口面向WWW的開發接口、二次應用開發接口等等。功能上,全文檢索系統核心具有建立索引、處理查詢返回結果集、増加索引、優化索引結構等功能,外圍則由各種不同應用具有的功能組成。
四、中間件
中間件是指網絡環境下處于操作系統、數據庫等系統軟件和應用軟件之間的一種起連接作用的基礎軟件,主要解決異構網絡環境下分布式應用軟件的互連與互操作問題,提供標準接口、協議,屏蔽實現細節,提高應用系統的易移植性。通過中間件相連接的應用系統,即使它們具有不同的接口,相互之間仍然能夠進行信息交換。通過中間件,應用程序可以工作于多個平臺或操作系統環境之中。根據使用需求,數字檔案室應用系統中間件主要有三類:
1.Web服務中間件,用以建立Web服務器,提供瀏覽器/服務器之間的信息傳遞服務,即BS服務。
2.數據庫安全訪問中間件,用以對數據庫的訪問過程進行加密,保證敏感信息不泄漏。
3.文件傳輸中間件,用于提供數字檔案原文傳輸服務,保證數字檔案資源快速安全的傳輸。
五、數字化加工軟件
雖然掃描儀都自帶掃描軟件,但功能一般比較簡單,只能做掃描儀設置、圖像掃描等處理,無法滿足紙質檔案數字化要求。當數字化工作采用外包形式實施時,無需購買數字化加工軟件;當采取自主開展批量紙質檔案數字化工作時,推薦采購功能上能夠滿足標準規范要求的數字化加工軟件,以便提高工作效率,保證數字化成果質量與標準化程度。一款合格的數字化加工軟件至少應滿足以下要求:
1.應符合行業標準、地方規范和同級國家綜合檔案館相關數字化要求,支持對文書、科技、專業等各種門類紙質檔案進行數字化加工與轉換;
2.能按要求將數字圖像存儲或轉換為TIF、JPG、雙層PDF等格式,并按規定批量發布、存儲、命名,能按要求定制紙質檔案數字副本命名規則;
3.具備數字化元數據采集功能,目錄數據雙機校對和檢索功能,以及工序日志管理功能;
4.具備格式、掃描分辨率、色彩空間、壓縮方案等技術參數自定義功能,具備糾偏、去噪、裁剪等基本的圖像處理功能;
5.具有圖像與目錄數據自動抽檢、自動比對等質量檢測功能;
6.具備數字化加工流程自定義功能。
六、虛擬化軟件
虛擬化( Virtualization)是一種資源管理技術。通過虛擬化軟件可以將服務器、網絡、內存及存儲等各種計算機實體資源進行匯聚、抽象、轉換后形成資源池,再在資源池上抓取其中的資源,模擬建立一個完整的虛擬計算機供用戶安裝操作系統、應用程序并操作使用。對用戶而言,虛擬機的應用環境與物理計算機并無兩樣。
采用云計算技術建設數字檔案室應用系統時,必須引入虛擬化技術并采購虛擬化軟件。當采購的某臺服務器性能過剩足以支撐多項服務時,虛擬化軟件可以在其上建立并同時運行多個虛擬計算機;也可以將多臺已使用多年、性能較低的計算機資源組合形成一個性能更強的虛擬機。每個虛擬計算機可運行不同的操作系統,并且應用程序都可以在相互獨立的空間內運行而互不影響,從而顯著提高計算機工作效率與使用效率,對計算資源作更加均衡的利用與分配,實現資源的動態分配、靈活調度、跨域共享。國產虛擬化軟件主要有曙光、浪潮、聯想、華為、中興、品高等諸多品牌,國外產品則以 VMware為代表。