数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。数据可以是连续的值,也可以是离散的。可选数据关係是指数据之间存在多种相关关係,如直接关係,一对一关係,一对多关係,多对多关係。
基本介绍
- 中文名:可选数据关係
- 外文名:optional data relation
- 学科:计算机
- 定义:数据之间存在多种相关关係
- 有关术语:相关关係
- 领域:资料库、数据分析
简介
可选数据关係是指数据之间存在多种相关关係,如一对一关係,一对多关係,多对多关係。可选数据关係在资料库中的数据模型和数据分析中都有重要套用。例如,在资料库中,由于数据存在多种可选数据关係,不同的数据关係,可能导致不同的数据模型,如层次模型、网状模型、关係模型。在数据分析中,不同的可选关係可能导致不同的结果和準确率。
相关关係
概述
相关关係,是指2个或2个以上变数取值之间在某种意义下所存在的规律,其目的在于探寻数据集里所隐藏的相关关係网。从统计学角度看,变数之间的关係大体可分两种类型:函式关係和相关关係。一般情况下,数据很难满足严格的函式关係,而相关关係要求宽鬆,所以被人们广泛接受。需要进一步说明的是,研究变数之间的相关关係主要从两个方向进行:一是相关分析,即通过引入一定的统计指标量化变数之间的相关程度;另一个是回归分析。由于回归分析不仅仅刻画相关关係,更重要的是刻画因果关係。
一对一关係
一对一关係是指关係资料库中两个表之间的一种关係,该关係中第一个表中的单个行只可以与第二个表中的一个行相关,且第二个表中的一个行也只可以与第一个表中的一个行相关。
一对多关係
一对多关係是关係资料库中两个表之间的一种关係,该关係中第一个表中的单个行可以与第二个表中的一个或多个行相关,但第二个表中的一个行只可以与第一个表中的一个行相关。
多对多关係
多对多关係是关係资料库中两个表之间的一种关係, 该关係中第一个表中的一个行可以与第二个表中的一个或多个行相关。第二个表中的一个行也可以与第一个表中的一个或多个行相关。
数据模型
资料库的类型是根据数据模型来划分的,而任何一个DBMS也是根据数据模型有针对性地设计出来的,这就意味着必须把资料库组织成符合DBMS规定的数据模型。目前成熟地套用在资料库系统中的数据模型有:层次模型、网状模型和关係模型。它们之间的根本区别在于数据之间联繫的表示方式不同(即记录型之间的联繫方式不同)。层次模型以“树结构”表示数据之间的联繫。网状模型是以“图结构”来表示数据之间的联繫。关係模型是用“二维表”(或称为关係)来表示数据之间的联繫的。
层次模型(Hierchical)
层次模型是资料库系统最早使用的一种模型,它的数据结构是一棵“有向树”。根结点在最上端,层次最高,子结点在下,逐层排列。层次模型的特徵是:

有且仅有一个结点没有父结点,它就是根结点;
其他结点有且仅有一个父结点。图所示为一个系教务管理层次数据模型,图(a)所示的是实体之间的联繫,图(b)所示的是实体型之间的联繫。
最有影响的层次模型的DBS是20世纪60年代末,IBM公司推出的IMS层次模型资料库系统。
网状模型(Network)
网状模型以网状结构表示实体与实体之间的联繫。网中的每一个结点代表一个记录类型,联繫用连结指针来实现。网状模型可以表示多个从属关係的联繫,也可以表示数据间的交叉关係,即数据间的横向关係与纵向关係,它是层次模型的扩展。网状模型可以方便地表示各种类型的联繫,但结构複杂,实现的算法难以规範化。其特徵是:

允许结点有多于一个父结点;
可以有一个以上的结点没有父结点。
下图所示为一个系教务管理网状数据模型。
关係模型(Relation)
关係模型以二维表结构来表示实体与实体之间的联繫,它是以关係数学理论为基础的。关係模型的数据结构是一个“二维表框架”组成的集合。每个二维表又可称为关係。在关係模型中,操作的对象和结果都是二维表。关係模型是目前最流行的资料库模型。支持关係模型的资料库管理系统称为关係资料库管理系统,Access就是一种关係资料库管理系统。图所示为一个简单的关係模型,其中图(a)所示为关係模式,图(b)所示为这两个关係模型的关係,关係名称分别为教师关係和课程关係,每个关係均含3个元组,其主码均为“教师编号”。

描述的一致性,不仅用关係描述实体本身,而且也用关係描述实体之间的联繫;
可直接表示多对多的联繫;
关係必须是规範化的关係,即每个属性是不可分的数据项,不许表中有表;
关係模型是建立在数学概念基础上的,有较强的理论依据。
在关係模型中基本数据结构就是二维表,不用像层次或网状那样的连结指针。记录之间的联繫是通过不同关係中同名属性来体现的。例如,要查找“刘晋”老师所上的课程,可以先在教师关係中根据姓名找到教师编号“1984030”,然后在课程关係中找到“1984030”任课教师编号对应的课程名即可。通过上述查询过程,同名属性教师编号起到了连线两个关係的纽带作用。由此可见,关係模型中的各个关係模式不应当是孤立的,也不是随意拼凑的一堆二维表,它必须满足相应的要求。