在计算机中,集群是使用多个计算机,如典型的个人计算机或UNIX工作站;多个存储设备;冗余互联,来组成一个对用户来说单一的高可用性的系统。集群计算能够被用来实现负载均衡,集群计算的倡导者提出,对一个企业来说,集群在许多情况下,能够达到99.999%的可用性。集群的一个主要思路就是,对外界来说,集群就像是一个唯一的系统。
基本介绍
- 中文名:集群
- 外文名:Cluster Computing
- 用途:在高流量的网站中实现负载均衡
- 出现时间:20世纪80年代
定义
在计算机中,集群(clustering)是使用多个计算机,如典型的个人计算机或UNIX工作站,多个存储设备和记忆冗余的互连线路来组成一个对用户来说单一的、高可用的系统。集群计算(clustering computing)能够被用来实现负载均衡。集群的倡导者提出,对一个企业来说,集群在许多情况下能够达到99.999%的可用性。集群的一个主要思路是,对外接来说,集群就像是一个唯一的系统。
集群的一个常用用途就是在一个高流量的网站中实现负载均衡。一个网页请求被送到“管理者”伺服器,然后此伺服器决定此请求由几个相同Web伺服器中的哪一个进行处理。这种Web Farm(根据配置有时候被这样称呼)将能够提升通信量和处理速度。
集群最早是在20世纪80年代DEC的VMS系统中出现的,IBM的sysplex是与集群接近的大型主机系统。微软、Sun微系统,以及其它主导硬体和软体流的公司提供有集群包,并保证提供可扩展性和可用性。随着通信量和可用性保证的增加,集群的整个部分或局部零件的大小与数量都可以增加。
集群计算还可以被用来进行低廉的并行计算,这些并行计算通常为科学研究或其它需要并行运算的套用服务。一个着名的例子就是裴欧沃夫(Beowulf)计画,它使用一定数量现成的个人计算机组成集群来实现科学套用。
集群技术
集群技术的出现和IA架构伺服器的快速发展为社会的需求提供了新的选择。它价格低廉,易于使用和维护,而且採用集群技术可以构造超级计算机,其超强的处理能力可以取代价格昂贵的中大型机,为行业的高端套用开闢了新的方向。
集群技术是一种相对较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益。
目前,在世界各地正在运行的超级计算机中,有许多都是採用集群技术来实现的。
集群是由一些互相连线在一起的计算机构成的一个并行或分散式系统。这些计算机一起工作并运行一系列共同的应用程式,同时,为用户和应用程式提供单一的系统映射。从外部来看,它们仅仅是一个系统,对外提供统一的服务。集群内的计算机物理上通过电缆连线,程式上则通过集群软体连线。这些连线允许计算机使用故障应急与负载平衡功能,而故障应急与负载平衡功能在单机上是不可能实现的。
伺服器集群系统通俗地讲就是把多台伺服器通过快速通信链路连线起来,从外部看来,这些伺服器就像一台伺服器在工作,而对内来说,外面来的负载通过一定的机制动态地分配到这些节点机中去,从而达到超级伺服器才有的高性能、高可用。
集群的优点
高可伸缩性:伺服器集群具有很强的可伸缩性。随着需求和负荷的增长,可以向集群系统添加更多的伺服器。在这样的配置中,可以有多台伺服器执行相同的套用和资料库操作。
高可用性:高可用性是指,在不需要操作者干预的情况下,防止系统发生故障或从故障中自动恢复的能力。通过把故障伺服器上的应用程式转移到备份伺服器上运行,集群系统能够把正常运行时间提高到大于99.9%,大大减少伺服器和应用程式的停机时间。
高可管理性:系统管理员可以从远程管理一个、甚至一组集群,就好像在单机系统中一样。
英文信息
Cluster computing
In computers, clustering is the use of multiple computers, typically PCs or UNIX workstations, multiple storage devices, and redundant interconnections, to form what appears to users as a single highly available system. Cluster computing can be used for load balancing as well as for high availability. Advocates of clustering suggest that the approach can help an enterprise achieve 99.999 availability in some cases. One of the main ideas of cluster computing is that, to the outside world, the cluster appears to be a single system.
A common use of cluster computing is to load balance traffic on high-traffic Web sites. A Web page request is sent to a "manager" server, which then determines which of several identical or very similar Web servers to forward the request to for handling. Having a Web farm (as such a configuration is sometimes called) allows traffic to be handled more quickly.
Clustering has been available since the 1980s when it was used in DEC's VMSsystems. IBM's sysplex is a cluster approach for a mainframe system. Microsoft, Sun Microsystems, and other leading hardware and software companies offer clustering packages that are said to offer scalability as well as availability. As traffic or availability assurance increases, all or some parts of the cluster can be increased in size or number.
Cluster computing can also be used as a relatively low-cost form of parallel processing for scientific and other applications that lend themselves to parallel operations. An early and well-known example was the Beowulf project in which a number of off-the-shelf PCs were used to form a cluster for scientific applications.