当前位置首页 > 百科> 正文

单机资料库

2020-12-20 05:39:54 百科
单机资料库

单机资料库

单机资料库就是只能运行在单机上,不提供网路功能的资料库。比如ACCESS,FOXPRO等都是单机资料库。

基本介绍

  • 中文名:单机资料库
  • 运行条件:单机
  • 建立要求:儘量减少数据的重複等
  • 举例:ACCESS,FOXPRO

发展阶段

人工管理阶段;
档案系统阶段;
资料库系统阶段;
高级资料库阶段。
当人们从不同的角度来描述这一概念时就有不同的定义(当然是描述性的)。例如,称资料库是一个“记录保存系统”(该定义强调了资料库是若干记录的集合)。又如称资料库是“人们为解决特定的任务,以一定的组织方式存储在一起的相关的数据的集合”(该定义侧重于数据的组织)。更有甚者称资料库是“一个数据仓库”。当然,这种说法虽然形象,但并不严谨。
严格地说,资料库是“按照数据结构来组织、存储和管理数据的仓库”。在经济管理的日常工作中,常常需要把某些相关的数据放进这样“仓库”,并根据管理的需要进行相应的处理。例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表中,这张表就可以看成是一个资料库。有了这个"数据仓库"我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个範围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此外,在财务管理、仓库管理、生产管理中也需要建立众多的这种"资料库",使其可以利用计算机实现财务、仓库、生产的自动化管理。
J.Martin给资料库下了一个比较完整的定义:资料库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种套用服务;数据的存储独立于使用它的程式;对资料库插入新数据,修改和检索原有数据均能按一种公用的和可控制的方式进行。当某个系统中存在结构上完全分开的若干个资料库时,则该系统包含一个“资料库集合”。
· 资料库的优点
使用资料库可以带来许多好处:如减少了数据的冗余度,从而大大地节省了数据的存储空间;实现数据资源的充分共享等等。此外,资料库技术还为用户提供了非常简便的使用手段使用户易于编写有关资料库应用程式。特别是近年来推出的微型计算机关係资料库管理系统dBASELL,操作直观,使用灵活,编程方便,环境适应广泛(一般的十六位机,如IBM/PC/XT,国产长城0520等均可运行种软体),数据处理能力极强。资料库在我国正得到愈来愈广泛的套用,必将成为经济管理的有力工具。
资料库是通过资料库管理系统(DBMS-DATA BASE MANAGEMENT SYSTEM)软体来实现数据的存储、管理与使用的dBASELL就是一种资料库管理系统软体。
· 资料库结构与资料库种类
资料库通常分为层次式资料库、网路式资料库和关係式资料库三种。而不同的资料库是按不同的数据结构来联繫和组织的。

数据结构模型

(1)数据结构
所谓数据结构是指数据的组织形式或数据之间的联繫。如果用D表示数据,用R表示数据对象之间存在的关係集合,则将DS=(D,R)称为数据结构。例如,设有一个电话号码簿,它记录了n个人的名字和相应的电话号码。为了方便地查找某人的电话号码,将人名和号码按字典顺序排列,并在名字的后面跟随着对应的电话号码。这样,若要查找某人的电话号码(假定他的名字的第一个字母是Y),那幺只须查找以Y开头的那些名字就可以了。该例中,数据的集合D就是人名和电话号码,它们之间的联繫R就是按字典顺序的排列,其相应的数据结构就是DS=(D,R),即一个数组。
(2)数据结构种类
数据结构又分为数据的逻辑结构和数据的物理结构。数据的逻辑结构是从逻辑的角度(即数据间的联繫和组织方式)来观察数据,分析数据,与数据的存储位置无关。数据的物理结构是指数据在计算机中存放的结构,即数据的逻辑结构在计算机中的实现形式,所以物理结构也被称为存储结构。本节只研究数据的逻辑结构,并将反映和实现数据联繫的方法称为数据模型。
目前,比较流行的数据模型有三种,即按图论理论建立的层次结构模型和网状结构模型以及按关係理论建立的关係结构模型。

层次结构模型

层次结构模型实质上是一种有根结点的定向有序树(在数学中"树"被定义为一个无回的连通图)。例如图20.6.4是一个高等学校的组织结构图。这个组织结构图像一棵树,校部就是树根(称为根结点),各系、专业、教师、学生等为枝点(称为结点),树根与枝点之间的联繫称为边,树根与边之比为1:N,即树根只有一个,树枝有N个。这种数据结构模型的一般结构见图20.6.5所示。
图20.6.4 高等学校的组织结构图 图20.6.5 层次结构模型
图20.6.5中,Ri(i=1,2,…6)代表记录(即数据的集合),其中R1就是根结点(如果Ri看成是一个家族,则R1就是祖先,它是R2、R3、R4的双亲,而R2、R3、R4互为兄弟),R5、R6也是兄弟,且其双亲为R3。R2、R4、R5、R6又被称为叶结点(即无子女的结点)。这样,Ri(i=1,2,…6)就组成了以R1为树根的一棵树,这就是一个层次数据结构模型。
按照层次模型建立的资料库系统称为层次模型资料库系统。IMS(Information Manage-mentSystem)是其典型代表。

网状结构模型

在图20.6.6中,给出了某医院医生、病房和病人之间的联繫。即每个医生负责治疗三个病人,每个病房可住一到四个病人。如果将医生看成是一个数据集合,病人和病房分别是另外两个数据集合,那幺医生、病人和病房的比例关係就是M:N:P(即M个医生,N个病人,P间病房)。这种数据结构就是网状数据结构,它的一般结构模型如图20.6.7所示。在图中,记录Ri(i=1,2,8)满足以下条件:
①可以有一个以上的结点无双亲(如R1、R2、R3)。
②至少有一个结点有多于一个以上的双亲。在"医生、病人、病房"例中,"医生集合有若干个结点(M个医生结点)无"双亲",而"病房"集合有P个结点(即病房),并有一个以上的"双亲"(即病人)。
图20.6.6 医生、病房和病人之间的关係
图20.6.7 网状结构模型
按照网状数据结构建立的资料库系统称为网状资料库系统,其典型代表是DBTG(Data Base Task Group)。用数学方法可将网状数据结构转化为层次数据结构。

关係结构模型

关係式数据结构把一些複杂的数据结构归结为简单的二元关係(即二维表格形式)。例如某单位的职工关係就是一个二元关係(见表20.6.8)。这个四行六列的表格的每一列称为一个栏位(即属性),栏位名相当于标题栏中的标题(属性名称);表的每一行是包含了六个属性(工号、姓名、年龄、性别、职务、工资)的一个六元组,即一个人的记录。这个表格清晰地反映出该单位职工的基本情况。

满足条件

通常一个m行、n列的二维表格的结构如表20.6.9所示。
表中每一行表示一个记录值,每一列表示一个属性(即栏位或数据项)。该表一共有m个记录。每个记录包含n个属性。
作为一个关係的二维表,必须满足以下条件:
(1)表中每一列必须是基本数据项(即不可再分解)。(2)表中每一列必须具有相同的数据类型(例如字元型或数值型)。(3)表中每一列的名字必须是唯一的。(4)表中不应有内容完全相同的行。(5)行的顺序与列的顺序不影响表格中所表示的信息的含义。
由关係数据结构组成的资料库系统被称为关係资料库系统。
在关係资料库中,对数据的操作几乎全部建立在一个或多个关係表格上,通过对这些关係表格的分类、合併、连线或选取等运算来实现数据的管理。dBASEII就是这类资料库管理系统的典型代表。对于一个实际的套用问题(如人事管理问题),有时需要多个关係才能实现。用dBASEII建立起来的一个关係称为一个资料库(或称资料库档案),而把对应多个关係建立起来的多个资料库称为资料库系统。dBASEII的另一个重要功能是通过建立命令档案来实现对资料库的使用和管理,对于一个资料库系统相应的命令序列档案,称为该资料库的套用系统。因此,可以概括地说,一个关係称为一个资料库,若干个资料库可以构成一个资料库系统。资料库系统可以派生出各种不同类型的辅助档案和建立它的套用系统。
· 资料库的要求与特性
为了使各种类型的资料库系统能够充分发挥它们的优越性,必须对资料库管理系统的使用提出一些明确的要求。

建立要求

(1)儘量减少数据的重複,使数据具有最小的冗余度。计算机早期套用中的档案管理系统,由于数据档案是用户各自建立的,几个用户即使有许多相同的数据也得放在各自的档案中,因而造成存储的数据大量重複,浪费存储空间。资料库技术正是为了克服这一缺点而出现的,所以在组织数据的存储时应避免出现冗余。
(2)提高数据的利用率,使众多用户都能共享数据资源。
(3)注意保持数据的完整性。这对某些需要历史数据来进行预测、决策的部门(如统计局、银行等)特别重要。
(4)注意同一数据描述方法的一致性,使数据操作不致发生混乱。如一个人的学历在人事档案中是大学毕业,而在科技档案中却是大学程度,这样就容易造成混乱。
(5)对于某些需要保密的数据,必须增设保密措施。
(6)数据的查找率高,根据需要数据应能被及时维护。

特徵

无论使用哪一种资料库管理系统,由它们所建立的资料库档案都可以看成是具有相同性质的记录的集合,因而这些资料库档案都有相同的特性:
(1)档案的记录格式相同,长度相等。
(2)不同的行是不同的记录,因而具有不同的内容。
(3)不同的列表示不同的栏位名,同一列中的数据的性质(属性)相同。
(4)每一行各列的内容是不能分割的,但行的顺序和列的顺序不影响档案内容的表达。

档案的分类

对档案引用最多的是主档案和事物档案。其他的档案分类还包括表档案、备份档案、档案的输出档案等。下面将讲述这些档案。
(1)主档案。主档案是某特定套用领域的永久性的数据资源。主档案包含那些被定期存取以提供信息和经常更新以反映最新状态的记录。典型的主档案有库存档案、职工主档案和收帐主档案等。
(2)事务档案。事务档案包含着作为一个信息系统的数据活动(事务)的那些记录。这些事务被分批以构成事务档案。例如,从每周工资卡上录製下来的数分批存放在一个事务档案上,然后对照工资清单档案进行处理以便列印出工资支票和工资记录簿。
(3)表档案。表档案是一些表格。之所以单独建立表档案而不把表设计在程式中是为了便于修改。例如,一个公用事业公司的税率表或国内税务局的税率就可以存储在表中档案。
(4)备用档案。备用档案是现有生产性档案的一个複製品。一旦生产性档案受到破坏,利用备用档案就可以重新建立生产性档案。
(5)档案档案。档案档案不是提供当前处理使用的,而是保存起来作为历史参照的。例如,国内税务局(IRS)可能要求检查某个人最近15年的历史。实际上,档案档案恰恰是在给定时间内工作的一个"快照"。
(6)输出档案。输出档案包含将要列印在印表机上的、显在萤幕上的或者绘製在绘图仪上的那些信息的数值映象。输出档案可以是"假脱机的"(存储在辅存设备上),当输出设备可用时才进行实际的输出。
声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:baisebaisebaise@yeah.net