当前位置首页 > 百科> 正文

格线(生物学与信息学)

2019-12-30 06:25:21 百科
格线(生物学与信息学)

格线(生物学与信息学)

格线(Grid),在信息学中,格线是一种用于集成或共享地理上分布的各种资源(包括计算机系统、存储系统、通信系统、档案、资料库、程式等),使之成为有机的整体,共同完成各种所需任务的机制。

基本介绍

  • 中文名:格线
  • 外文名:Grid
  • 信息学定义:集成或共享地理上分布的各种资源
  • 生物学定义:支柱和细层组成的格线状骨骼结构
  • 构件系统方法:传统方法、格线方法等
  • 优势:资源共享、协同工作、可扩展性等

格线定义

格线是一种新兴的技术,正处在不断发展和变化当中。学术界和商业界围绕格线开展的研究有很多,其研究的内容和名称也不尽相同因而格线尚未有精确的定义和内容定位。比如国外媒体常用“下一代网际网路”、 “Internet2 ”、“下一代Web”等来称呼格线相关技术。但“下一代网际网路(NGI)”和“Internet2”又是美国的两个具体科研项目的名字,它们与格线研究目标相交叉,研究内容和重点有很大不同。企业界用的名称也很多,有内容分发(Contents Delivery)、服务分发(Service Delivery)、电子服务(e-service)、实时企业计算(Real-Time Enterprise Computing,简称RTEC)、分散式计算Peer-to-Peer Computing(简称P2P)、Web服务(Web Services)等。中国科学院计算所所长李国杰院士认为,格线实际上是继传统网际网路、Web之后的第三次浪潮,可以称之为第三代网际网路套用。
格线是利用网际网路把地理上广泛分布的各种资源(包括计算资源、存储资源、频宽资源、软体资源、数据资源、信息资源、知识资源等)连成一个逻辑整体,就像一台超级计算机一样,为用户提供一体化信息和套用服务(计算、存储、访问等),虚拟组织最终实现在这个虚拟环境下进行资源共享和协同工作,彻底消除资源“孤岛”,最充分的实现信息共享。
格线(Grid)这个词来自于电力格线(PowerGrid)。“格线”与“电力格线”形神相似。一方面,计算机网纵横交错,很像电力网;另一方面,电力格线用高压线路把分散在各地的发电站连线在一起,向用户提供源源不断的电力。用户只需插上插头、打开开关就能用电,一点都不需要关心电能是从哪个电站送来的,也不需要知道是水力电、火力电还是核能电。建设格线的目的也是一样,其最终目的是希望它能够把分布在网际网路上数以亿计的计算机、存储器、贵重设备、资料库等结合起来,形成一个虚拟的、空前强大的超级计算机,满足不断增长的计算、存储需求,并使信息世界成为一个有机的整体。
早期格线的目标是期望能够像使用电力一样方便地使用分布在网路上强大而丰富的计算能力,而不用理会这种计算力是在哪个地点、以何种形式产生的。格线技术被看作是继传统网际网路、Web之后的第3次网际网路浪潮,也被称为第3代网际网路套用,其主要特点是通过提供资源级的共享,从而消除信息孤岛、实现应用程式在更高层次上的互动与协作。目前,在格线计算的研究上,对信息与知识孤岛的消除、实现对它们的共享也已成为一个研究的侧重点。目前格线计算主要可以分为计算格线、信息格线与知识格线3个层次。

满足条件

格线必须同时满足三个条件:
  • 在非集中控制的环境中协同使用资源;
  • 使用标準的、开放的和通用的协定和接口;
  • 提供非平凡的服务。

无线数据

工业使用的无线系统大多採用与蜂窝行动电话相似的射频连线,用点对点,或点对多点进行数据传送。但是,麻省理工学院媒体研究室指出,传统的无线语音通信方式,在数据服务中表现出过分地不足:非常刚性的系统结构中,虽经谨慎的系统预计,仍然丢失信号。
相反,格线式无线网路是一个由多重複链路的接/发节点构成的系统,节点间彼此互助,将数据沿网路传送,特别适合恶劣工作条件。格线的安装不必过于谨慎,随便把它们丢到什幺地方,它就可以变成可靠的、灵活的系统,并能随意扩展到千千万万个设备上。

网路共性

麻省理工学院为格线式网路开发的拓扑结构,是一个点对点对点,或对等点对对等点的系统,也就是一个由具有重複接/发功能的节点组成的网路。每个节点都能接收/传送数据,也和路由器一样,将数据传给它的邻接点。通过中继处理,数据包用可靠的通信链路,贯穿中间的各节点,抵达指定目标。
相似于网际网路和其他点对点路由网,格线式网路拥有多个冗余的通信路径。如果一条路径在任何理由下中断(包括射频干扰中断),格线网将自动选择另一条路径,维持正常通信。一般情况下,格线网能自动地选择最短路径,提高了连线的质量。根据实践,如果距离减小两倍,则接收端的信号强度会增加四倍,使链路更加可靠,还不增加节点发射功率。格线式网路里,只要增加节点数目,就可以增加可及範围,或从冗余链路的增加上,带来更多的可靠性。
  1. 自我配置和自修复性:格线式网路具有自我配置的特性,不需要人为的干预。增添新设备或旧设备移址都十分简单,只需在新址接通电源后,格线网就会发现这个新节点,自动地把它纳入现有的系统。格线式网路不仅生来就有高可靠性,而且还有高适应性。如果感测器或数据接收端,与固定的射频通信源相距太远,只需要在其间多布置几个中继节点,间隙便可填平。线连的网际网路上,如果某个路由器停止工作,数据包则经其他的节点,选择另一个链路传送数据。与此相似,如果格线式网路中某个节点或链路失灵,数据包也会自动选择其他的路径。一、两个节点的丢失,对格线产生不了致命的影响,格线式网路具有自愈的能力,不需要外来的人力重新安排路径。
  2. 冗余性和可扩性:真实世界里的冗余性意味着系统的安全储备程度,和使用者精心管理的紧张程式。没有冗余的系统是不可靠的系统;冗余太多的系统,又带来太大的浪费。格线式网路的无线络中,冗余是节点密度带来的基本功能。为了可靠性,需要精心设计的系统,在格线中只要多几个节点便完成。每个节点有多条链路,根据情况自动选择路由。其他的无线系统,很少有这种取得冗余的方式。格线式网路也有极好的可扩性,可以扩展到管理几百到几千个节点。因为这个系统没有中央控制单元,增添多个连结点或网关,不存在任何麻烦。
  3. 可靠性、适应性和可扩性是今天无线通信和工业控制十分重视的性能。点对点的网路有良好的可靠性,但无法扩展到使节点拥有多条链路。一点对多点的网路可以管理多个端点,但可靠性受制于访问点和端点的配置。在环境条件恶劣的情况下,一点对多点的网路难以提高可靠性。与它们相反,格线网在环境或结构的制约下,内在地赋含可靠性和适应性,并可被任意扩展到几千个端点。
格线式网路在工业控制中使用时,还可以实现分散式控制和诊断式监测。

无线通信

今天的格线式无线区域网路主要使用基于802.11a/b/g的标準,但能够被任何射频技术扩充,例如UltraWideband或802.15.4 Zigbee。因为连网智慧型装在每个节点上,不用任何中央交换机。格线的运作只取决于带有网路处理器,交换功能和系统软体的每一个智慧型节点。
为了在格线内部实现节点间的通信,每个节点都具有自我发现的能力。首先,它们必须决定是否只在无线系统中当成一个访问点,如同网路主干为另一个节点传送数据,或者扮演一个组合功能的角色。其次,这些特定的节点使用查询/回响协定确定它的近邻。这些运算不能占用太大的资源,不能超过链路可获频宽的1%到2%。
节点相互识别中,主要权衡的是路径信息,例如信号的接收强度、吞吐量、出错率和等待时间。这些数据必须在邻接的各点上互动,又不能占用太大的频宽。然后,根据这些数据决定最佳路径。所以,任何瞬间都可取得当时的最佳质量。
链路发现和路径选择都在后台进行,所以每个节点都知道当前有哪些邻接点,并频繁地运算,找出最佳路径。如果某个节点出于维修、重新安排,或故障等任何原因停止工作,邻近的节点立即重新记录,重新运算,选择路径。这种自我修复或故障超越的能力,是格线式无线网有别于其他无线通信的主要标记。
每一个节点都是一个自我管理的节点,又是一个网路的有机组成部分。该网路可从某个指定点进行管理和配置,形成一个实体。使用系统管理程式SNMP,监测某个特定的单元、节点、域或整个网路。发现协定(Discovery Protocols)简化了搜查和定位某个指定节点的过程,并把它们显示在管理者的萤幕上。
格线网依赖各种管理、控制和发现的报文,所以需要安全措施,採用带内报文、加密隧道,防範窃听和攻击。标準化的安全技术例如802.1x和Advanced Encryption Standard加密,确保了节点和设备的安全。

格线魅力

业界的重量级公司,例如Cisco和Intel,确认格线技术是当下无线通信符合逻辑的下一步延伸。格线的使用可以帮助各企业迅速地建立起新的无线网,或在不需要线连基站的条件下,扩展现有的WLANs。具有格线多链路的基站,容易实现负荷的均衡,因为它们可以为数据传输选择最佳的路径。此外,工业用户还能用嵌入的无线格线,迅速建立起感测器和控制器的网路,进行工业管理和运输管理。
格线技术的新崛起者和传统IT老公司,纷纷出售他们具有格线功能的无线区域网路。负责标準制定的相关机构,正在拟定把格线纳入802.11(即WiFi),以及刚刚与公众见面的802.16(亦即WiMax)标準的补充细则。嵌入式市场方面,格线技术开始形成标準,例如ZigBee。
其实,格线的基本概念并不是什幺新发明,仅仅是把网际网路连线世界里的实践,扩展进无线世界。PacketHop工程副总裁Sott Burke说:“今天固定式的网际网路就是一个大型的固定式格线网。”
格线网上的每个设备收/送它自己的数据时,同时又为其他的设备扮演了一个路由器的角色。每个设备的内在智慧型,使它能自动配置一个有效的网路,并当某个节点超载到失效之际,重新调整链路。格线网的优点不仅容易设定,并能从一个中央连线链路,无线地扩展覆盖一个很大的地区,而且具有很强的生存能力。
也许这是军事机密,无线格线是美国五角大楼高级防务研究机构(Defense Advanced Research Project Agency)推出的研究成果。PacketHop的早期技术,源于斯坦福研究院为五角大楼进行的研究,为野战士兵装备轻巧的高速无线数据网。佛罗里达崛起的新公司MeshNetworks也是源于高级防务研究机构,开发格线技术。
军事部门和安全部门仍然是格线产品最直接的市场。“这个市场需求量很大,”Burke先生说。

企业格线

Nortel和几家从事格线开发的新公司,确认格线式WLAN会给企业带来更多的利益。今年上半年Nortel向市场提出了Wi-Fi格线产品--Wireless 7200 Series。“传统的WLAN方案中,每个节点都和主干网连线,但我们在格线式WLAN中免除掉这个需要,”无线格线网商务开发经理Peter Zwinkels说,“使我们在布线困难或布线费用太高的未布网地区,实现了无线区域网路。”
这些地区包括室内外面积很大的空间,例如仓库和高尔夫球场。电源是难题之一,也许这里连交通管理的红绿灯和路灯都没有。但是, Nortel向公众承诺,只要传统的连线网路能生成的地方,就能用乙太网本身向节点提供电源。
Intel在新泽西州Dartmouth大学的格线试验中,把每个学生在校园空间的每个地方,与该校的网路连线。春季实施的这个计画,为学生提供了宽频连线,并且需要向电话公司和电缆公司付费。
这些研究表明,格线主要用于广域宽频无线连线。虽然市场信息表明Wi-Fi热点正匆忙地在美国的咖啡店、火车站、机场……兴起,但无线ISPs和电信公司认为,他们可以用Wi-Fi热点的扩展格线吸引用户,在销售网际网路、标準的行动电话和3G服务中当作赠品。格线技术可以巨大地加速宽频服务的发展趋势:取代大量的T1和ADSL线路,每个无线节点都是热点,只需要一条高频宽的连线,就能用无线格线覆盖整个地区。Nortel把这个归纳成“热区”,并宣称这个系统不仅价格便宜,而且覆盖性能优于当前热点的大杂烩。
使用“热区”
某些城市準备为工作人员推出类似的服务。Verge Wireless公司为例,它已在Baton Rouge和纽奥良市,推出热区型的格线服务。
某些ISPs仍在等待无线通信的最终方案,用WiMax为难以连线的地区提供宽频服务。但Nortel认为,以Wi-Fi为基础的格线技术,可以更好地满足这些地区。“没有DSL线路的地区,WiFi格线可以为一个小村庄,100~200户居民提供宽频服务,”Zwinkels先生说。“MiMax要求用户安装特殊设备,但Wi-Fi格线只需要用户用标準的PMCIA卡插入计算机。”
射频识别技术(RFID)之后,嵌入式格线得到进一步发挥。取代固定式的扫描设备,格线上的感测器和控制器在无线网上彼此交谈,传送信息。波士顿的Ember公司,专门製造RF晶片,用在大型运输机上,监视被运送的货箱。感测器满布在各个货箱上,不仅记录了货箱内物品的详细资讯,而且传送出运输过程中货箱存放的状态。为了反恐的目的,美国各航空港将迅速使用这种无线监测系统,取代缓慢昂贵的海关人力检查。
“货箱就是一个网,每个货箱在一个较大的格线式网路内,形同一个节点,”Ember的商务主管Jim Schoenberjer说。“因为货箱本身就是网路的组成部分,所以港口或机场都不再需要安装天线,格线是一个基础设施很少的通信系统。”
嵌入式格线还可以用来收集家庭水电气表的读数,或装进电灯开关,减少不必要的电线。Ember公司正在拟定ZigBee标準,它是EmberNet技术的一个组成部分。

格线标準

很多新公司如BelAir Networks,Tropos,FireTide和Strix System都在研发格线产品。虽然大多数产品都是在Wi-Fi的标準下扩展出来的,但各家的方法是不同的。这些专利的产品彼此缺少互操作性,所以不能在一起工作。既然格线要进入社会基础设施,标準的制定是一件迫切重要的事情。
按照IEEE的规矩,为了制定一个标準,首先要由某个单位提出倡议,然后成立研究小组,最后才有标準制定的工作组。
2003年十二月底,Intel和Cisco就宣布要在温哥华IEEE会议上提出倡议,制定格线式无线网路的标準。
“当前的情况是明白的,”出版物Wi-Fi Plant的编辑Eric Griffith说。“Nortel和一大堆新公司都在搞格线产品,如果把这些产品放在一起,彼此完全不能交谈。有些公司用蜂窝技术,有些公司用802.11a。蜂窝格线可以沿电话线桿架设,达到较远的範围。802.11a在短距离的使用中效果好,不受802.11b或802.11g干扰。”
经由Intel、Cisco、MeshNetworks和其它公司的倡议,IEEE成立了格线研究组,希望最终把格线补充入无线区域网路的标準。今年一月,研究组举行了第一次会议。评论家认为标準会在“最小公分母”的原则下完成。那时,各种专利协定的锐利功效会受到很大的限制。所以,MeshNetworks公司正在重新打包它的专利,当作可授权产品,瞄準各无线设备製造商,2004年第二季度开始对外授权。
“非常有趣,Intel捲入这件事情,”Griffith说。“Intel绝对愿意从晶片级上为格线提供标準。我的印象里,Intel想弥补过去的小小过失,他们太晚地进入Wi-Fi,现在一定要在WiMax和格线上走到前沿。”
格线式无线区域网路是无线通信发展的逻辑归宿。从现有无线标準繁衍出新的功能,最能符合大多数厂商和用户的利益。一意孤行的专利标準虽然有暂时的优势,但得不到技术进一步发展的认同。只有把握技术发展主流,参与国际共同研究,才是最把稳的方式。
个案研究:美国德州加兰德市
加兰德(Garland),距达拉斯城东北15英里,人口22.1万,为社会安全人员,例如警官、消防队员和医院急诊室工作人员更换通信系统。Lockheed Martin去年九月取得这个契约,选用了MeshNetworks的格线技术,代替蜂窝式通信系统。新系统将覆盖57平方英里,是全世界最大的格线式移动通信网。按计画,该项目2004年第二季度完成,先提供移动数据服务,然后再有图像和语音服务。
格线技术为加兰德市带来很大的利益,比原来基础设施的频宽提高了50倍。“我们免除掉老系统要求的通信塔、线路租金和分区等头痛的事情,”通信经理Darrell McClanahan说。“格线系统保持1Mbps的正常吞吐量,高峰可达6Mbps。”
新系统只需要PC卡、无线中继器、网关、地理位置软体,经过改装的Pocket PC掌上机和指挥控制中心的伺服器。中继器和网关挂在建筑物、街灯,或交通管制红绿灯上,为下一个中继器和设备提供能源。PC卡和PDAs也扮演中继者和路由器的角色,使网路变得非常强健。地理位置软体在不用GPS的条件下,提供纬度、经度和海拔高度等信息。该系统支持工业标準TCP/IP,DHCP和SNMP。
加兰德市选择格线通信系统前,于2003年在NexGen城沿190高速公路5平方英里的地区做试验,两辆汽车相反的方向行驶在每小时60英里的速度时,以通过量1.5Mbps成功地完成了实时的流式图像,VoIP呼叫。
移动通信专家Tim Scannell谈格线
问:按Zigbee国际联盟的发起,IEEE 802.15.4的一个重要的可操作概念就是用来组建格线网。每个802.15.4节点可用作动态的路由器,从一个网关延伸到无限的距离,只要在这个区域内布置节点。这并非一个新概念,但要它能自我组建、自我治癒仍然是一种挑战。
是否可以用IEEE 802.15.4完成格线式网路,IEEE 802.16技术是否也有类似的可行性?即通过内部合作,实现宽频访问网际网路无限制的可及範围?
答:当我们铺设了日益增多的无线网,使用了各式各样不同的技术,这些网将最终用格线的环境连在一起,成为最强的,或至少能跨越不同的边界和标準的相互通信。蜂窝技术沿一个单元通信塔向下一个通信塔跳跃,使用户无缝地漫游在格线通信框架内,攫取最强的可获信号,构成无线连线。
Cometa Networks这样的新公司,探索重叠使用802.11(Wi-Fi)网,在大範围内提供格线无线访问环境,其基本目的还是城域网(MANs)的想法。问题在于为了实现可操作性和可靠性,网上的每个访问点不能中断运行。如果某个区段中断,就会变成弱链路区,服务遭到损害,和圣诞节的大面积灯串妆饰中不亮的灯泡相似。
Zigbee承诺把无线功能注入大量设备和非通信系统例如内置的环境控制,但不是格线的最佳选择。Zigbee不适用于连续的通信系统,因为预设定之外的时间,或不被激活的节点处于睡眠状态。但它能保持电池的长寿命,一个电池用5年,使系统在很长的周期内生存。Zigbee可以传送小型的数据包,但不适用于大容量的信息。
射频识别系统(RFID)也有类似之处,用在传送有限的数据信息,系统的大部分处于被动地位,直到读入器激活它们。最终,我们将更多地使用主动的RFID系统,用于零售业和物流运输。
虽然格线管理、控制和收费都存在问题,但都能解决。我们已能监视和控制射频,用分层技术和各种算法就能管理从A点向延伸点Z的数据流。Zigbee和RFID的格线可以通信和交换数据,但802.11将是更加通用的技术。

结构体系

格线特徵

在介绍格线的特徵之前,我们首先要解决一个重要的问题:格线是不是分散式系统?这个问题之所以必须回答,因为人们常常会问另一个相关的问题:"为什幺我们需要格线?现在已经有很多系统(比如海关报关係统、飞机订票系统)实现了资源共享与协同工作。这些系统与格线有什幺区别?"
对这个问题的简要回答是:格线是一种分散式系统,但格线不同于传统的分散式系统。IBMGlobal Service与EDS是在这个分散式领域最着名的公司。构建分散式系统有三种方法:即传统方法(我们称之为EDS方法)、分布自律系统(Autonomous Decentralized Systems, ADS)方法,格线(grid)方法。ADS通常用于工业控制系统中。格线方法与传统方法的区别见下表:
特徵 传统分散式系统 格线
开放性 需求和技术有一定确定性、封闭性 开放技术、开放系统
通用性 专门领域、专有技术 通用技术
集中性 很可能是统一规划、集中控制 一般而言是自然进化、非集中控制
使用模式 常常是终端模式或C/S模式 服务模式为主
标準化 领域标準或行业标準 通用标準(+行业标準)
平台性 套用解决方案 平台或基础设施
通过以上对比,格线具有以下四点优势:
(1)资源共享,消除资源孤岛:格线能够提供资源共享,它能消除信息孤岛、实现应用程式的互连互通。格线与计算机网路不同,计算机网路实现的是一种硬体的连通,而格线能实现套用层面的连通。
(2)协同工作:格线第二个特点是协同工作,很多格线结点可以共同处理一个项目。
(3)通用开放标準,非集中控制,非平凡服务质量:这是Ian Foster最新提出的格线检验标準。格线是基于国际的开放技术标準,这跟以前很多行业、部门或者公司推出的软体产品不一样。
(4)动态功能,高度可扩展性:格线可以提供动态的服务,能够适应变化。同时格线并非限制性的,它实现了高度的可扩展性。

格线体系

格线之所以能有以上所说的种种优势特徵,是由格线的体系结构赋予它的。格线体系结构的主要功能是划分系统基本组件,指定组件的目的与功能,刻画组件之间的相互作用,整合各部分组件。科研工作者已经提出并实现了若干种合理的格线体系结构。下面介绍影响比较广泛的两个格线体系结构:格线计算协定体系结构(Grid Protocol Architecture,GPA)和计算经济格线体系结构(GRACE)模型。
OGSA(Open Grid Services Architecture)被称为是下一代的格线体系结构,它是在原来“五层沙漏结构”的基础上,结合最新的Web Service 技术提出来的。OGSA包括两大关键技术即格线技术和Web Service 技术。
随着格线计算研究的深入,人们越来越发现格线体系结构的重要。格线体系结构是关于如何建造格线的技术,包括对格线基本组成部分和各部分功能的定义和描述,格线各部分相互关係与集成方法的规定,格线有效运行机制的刻画。显然,格线体系结构是格线的骨架和灵魂,是格线最核心的技术,只有建立合理的格线体系结构,才能够设计和建造好格线,才能够使格线有效地发挥作用。
OGSA最突出的思想就是以“服务”为中心。在OGSA框架中,将一切都抽象为服务,包括计算机、程式、数据、仪器设备等。这种观念,有利于通过统一的标準接口来管理和使用格线。Web Service提供了一种基于服务的框架结构,但是,Web Service 面对的一般都是永久服务,而在格线套用环境中,大量的是临时性的短暂服务,比如一个计算任务的执行等。考虑到格线环境的具体特点,OGSA 在原来Web Service 服务概念的基础上,提出了“格线服务(Grid Service)”的概念,用于解决服务发现、动态服务创建、服务生命周期管理等与临时服务有关的问题。
基于格线服务的概念,OGSA 将整个格线看作是“格线服务”的集合,但是这个集合不是一成不变的,是可以扩展的,这反映了格线的动态特性。格线服务通过定义接口来完成不同的功能,服务数据是关于格线服务实例的信息,因此格线服务可以简单地表示为“格线服务=接口/行为+服务数据”。
在当下,格线服务提供的接口还比较有限,OGSA 还在不断的完善过程之中,下一步将考虑扩充管理、安全等等方面的内容。

格线协定

Ian Foster于2001年提出了格线计算协定体系结构,认为格线建设的核心是标準化的协定与服务,并与Internet网路协定进行类比。其示意图如图所示。
格线(生物学与信息学)
该结构主要包括以下五个层次:
构造层(Fabric):控制局部的资源。由物理或逻辑实体组成,目的是为上层提供共享的资源。常用的物理资源包括计算资源、存储系统、目录、网路资源等;逻辑资源包括分散式档案系统、分布计算池、计算机群等。构造层组件的功能受高层需求影响,基本功能包括资源查询和资源管理的QoS保证。
连线层(Connectivity):支持便利安全的通信。该层定义了格线中安全通信与认证授权控制的核心协定。资源间的数据交换和授权认证、安全控制都在这一层控制实现。该层组件提供单点登录、代理委託、同本地安全策略的整合和基于用户的信任策略等功能。
资源层(Resource):共享单一资源。该层建立在连线层的通信和认证协定之上,满足安全会话、资源初始化、资源运行状况监测、资源使用状况统计等需求,通过调用构造层函式来访问和控制局部资源。
汇集层(Collective):协调各种资源。该层将资源层提交的受控资源汇集在一起,供虚拟组织的应用程式共享和调用。该层组件可以实现各种共享行为,包括目录服务、资源协同、资源监测诊断、数据複製、负荷控制、账户管理等功能。
套用层(Application):为格线上用户的应用程式层。套用层是在虚拟组织环境中存在的。应用程式通过各层的应用程式编程接口(API)调用相应的服务,再通过服务调动格线上的资源来完成任务。为便于格线应用程式的开发,需要构建支持格线计算的大型函式馆。

格线运用

现在国内国外运用得最多的可能是在一些大型院校的计算格线(实现计算资源的共享。 什幺是计算资源: 简单来说就是计算能力,CPU。 计算资源共享就是CPU计算的共享)。人们把一个集群(cluster, 也就是常说的机房,通常有几十台作业系统为Linux的计算机)的计算机连成一个局域型格线。这样就好像把这几十台电脑连成了一台超级计算机,计算能力当然大大提高了。这种局域计算格线主要运用于一些科研的研究。比如说生物科学。当生物科学的研究员需要高性能的计算资源来帮助他们分析试验的结果时,他们就把这些分析试验的程式提交(submit)给格线,格线通过计算再把结果返回给这些研究员。计算结果可能是一些图像(rendering)也可能是一些数据。这些计算如果在单一PC(Personal computer, 个人计算机)上运行的话,往往会花费几个月的时间,然而在格线中运行一,两天也就完成了。这就是格线技术最直观的优点之一。当然有一些大型主机(super-mainframe)也有很强的计算能力(比如常说的IBM deepblue,打败人类西洋棋大师Kasparov那位),但是这种主机太昂贵,而且配置(deploy)往往不方便,是名副其实的重量级(heavyweight)计算。1996年初,美国数学家和程式设计师乔治· 沃特曼编制了一个梅森素数计算程式,并把它放在网页上供数学家和数学爱好者免费使用,这就是着名的“网际网路梅森素数大搜寻”(GIMPS)项目。现在只要人们去GIMPS的主页下载那个免费程式,就可以通过计算格线来搜寻新的梅森素数。SETI@Home,一个分散式计算的项目,通过网际网路上的计算机搜寻地球外智慧讯息,格线在分散式计算的成功运用。)的网站指出,世界上最强大的计算机IBM 的 ASCI White,可以实现每秒12万亿次的浮点运算,但是花费了1亿千万美元;然而SETI@HOME只用了50万美元却实现了每秒15万亿次浮点运算。
格线另外一个显着的运用可能就是虚拟组织(Virtual Organisations)。这种虚拟组织往往是针对与某一个特定的项目,或者是某一类特定研究人员。在这里面可以实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。比如说中国2008年奥运会开幕式研究组就可以运用格线组成一个虚拟组织。在这个虚拟组织里,任何成员不管在哪个地方都可以有权访问组织的共享资源(如 开幕式场地图纸,开幕式资金,开幕式节目单);而且可以和另一地方的虚拟组织成员进行交流。这个虚拟组织就像把所有奥运会开幕式的资源,信息,以及人员集中到了一个虚拟的空间,让人们集中精力研讨开幕式项目的问题,而不必考虑其他的问题。据个实例,由英国利兹大学,牛津大学,约克大学和谢菲尔德大学合作的DAME项目就是致力于研究和运用虚拟组织。DAME架构在这四个大学合建的白玫瑰格线White Rose Computational Grid (WRCG)上,运用于对飞机故障的快速检测和维修。

基础设施

首先,我们来看看有哪些典型的格线基础设施组件,每一种组件如何对应用程式的架构、设计和部署产生影响。下面是格线基础设施中的一些主要组件:
安全性。安全性是格线计算中的重要问题。每一种格线资源都可能需要遵从多种不同的安全策略。单点登录认证是一种必不可少的方法。得到普遍遵守的协商授权机制也是很必要的。
资源管理。当提交一项任务的时候,格线资源管理器需要考虑如何为该任务指派资源、如何监视其状态以及如何返回它的执行结果。
信息服务。由于格线资源管理器在指派资源之前要经过综合全面的考虑,因此它需要知道哪些格线资源是可用的,以及这些资源的容量与当前使用的情况。这些有关格线资源的知识是通过格线信息服务(Grid Information Service,GIS)维护和提供的,又称为监视与发现服务(Monitoring and Discovery Service,MDS)。
数据管理。数据管理主要解决任务如何传输数据以及如何访问共享存储的问题。

其他特性

可靠性
可靠性是计算领域内永恆的话题,格线环境也不例外。实现这一难题最好的方法是预见所有可能出现的失败情况,并提供解决这些情况的手段。最可靠的方法能够“容纳异常情况的出现”(surprise tolerant)。格线计算的基础设施必须处理主机中断和网路中断等情况。下面列出一些需要考虑的方法:
  • 使用检查点-重启机制。
  • 用持久性存储保存中间结果。
  • 用心跳监视机制跟蹤系统状态。
  • 用健壮的系统管理解决方案最大程度地提高格线及其组件的可用性。
拓扑问题
格线计算的分散式本质使地理上和组织机构上的大跨度变得不可避免。随着内部格线的拓扑扩展为外部格线拓扑,複杂程度也逐渐提高。比如说,非功能性操作需求,安全性、目录服务、可靠性、性能等都变得更加複杂。让我们来研究一下拓扑的问题。
网路拓扑。格线架构内的网路拓扑可能在很多不同方面上呈现出来。网路组件可以表示 LAN 或校园网的连通性,甚至还能表示格线网路之间 WAN 的通信情况。网路的职责是为所有的格线系统提供充足的频宽。像基础设施中其他的组件一样,我们可以通过定製网路来提供更高级别的可用性、性能以及安全性。
出于安全性以及其他一些架构性的限制,格线系统从很大程度上来说是网路密集型的。尤其是数据格线,它可能在整个企业的网路内散布着一些存储资源,因此在基础设施的设计中,为了保证足够的性能,关键因素就在于处理数量巨大的网路负载。
启用应用程式时应该考虑的问题包括如何使网路通信量最小,如何使网路延迟最短。假设应用程式的设计已经能够保证最小的网路通信量,那幺就有几种方法可以使网路延迟最短。比如说,千兆以太区域网路可以用来支持高速群集,或实现远程网路之间的高速 Internet 骨干网。
数据拓扑。我们最希望把任务指派到距离它所使用的数据最近的机器上执行。这样可以降低网路的通信量,还可能降低可测量性方面的限制。
数据需要存储空间。在一个格线的设计中,存储的可能性问题是没有止境的。存储要求一定的安全性、要可以进行备份、要可管理,还/或要进行複製。在格线的设计中,您需要确定您的数据对于需要它的资源来说一直是可用的。除了可用性之外,您还需要保证数据得到适当的保护,因为您不能让未经授权的人访问到敏感的数据。最后,您需要最佳的数据访问性能。显然,频宽和访问数据的距离两者是相互有关的,但是您不会希望让 I/O 问题阻碍格线应用程式的运行速度。对于那些磁碟密集型的应用程式,或是数据格线而言,您可以将工作重点更多地放在存储资源上,比如您可以使用那些能够提供更高容量、冗余程度或容错机制的存储。
声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:baisebaisebaise@yeah.net