• 1
  • 2
  • 3
  • 4
  • 5
百家谈云计算 首 页  »  帮助中心  »  云服务器  »  百家谈云计算
钱德沛:云计算需要实质性研究
发布日期:2016-5-22 11:5:36

  

  北京航空航天大学计算机学院教授钱德沛

  网格作为863的重大项目网格我搞了几年,我一直在想云(如阿里云)计算跟网格有那些区别,哪些是新的哪些是原来的概念。我有一点不成熟的想法跟大家交流。

  首先什么是云计算?刚才刘院长讲的很清楚了,云就是互联网,做网络的我们总是把网络抽象成云。云计算就是基于互联网计算,可以支持互联网各类应用的系统。一般是第三方应用,我们这里也许会有新的产业形式,而且是统一安排的数据中心的集合形式出现。包括几个大的公司,IBM等等,Google本来内部就有这样的机制。本来是以第三方拥有的机制提供服务。为了完成功能,用户只关心需要的服务,这是云计算基本的定义。

  到底云计算在技术上有哪些特点,我最近反复和网格比较,和传统的分布计算在比较。第一是低成本,这是很突出的特点,因为这是技术条件到了这个程度,主要目的也是为了降低成本,不完全为了聚合资源完成这么大的任务。第二虚拟机的支持,虚拟机起了很大的作用,因为虚拟机这几年发展的很快,有了虚拟机在网络环境下的一些原来比较难做的事情现在比较容易处理。第三我觉得是镜象部署的执行,这样就也许使得我过去很难处理的异构的程序的执行互操作变得比较容易处理。第四强调服务化,服务化有一些新的机制,特别是更适合商业运行的机制,我觉得这些是云计算和现在的分布系统计算活动的新特点。

  我们看一下网格,网格我们谈了有10年以上,从96年开始。网格基本形态是什么?是跨地区的,甚至跨国家的,甚至跨洲的这样一种独立管理的资源结合。资源在独立管理,并不是进行统一布置、统一安排的形态。网格这些资源都是异构的,不强调有什么统一的安排。

  另外网格的使用通常是让分布的用户构成虚拟组织,在这样统一的网格基础平台上用虚拟组织形态从不同的自治域访问资源。网格一般由所在地区、国家、国际公共组织资助的,支持的数据模型很广,从海量数据到专用数据及到大小各异的临时数据集合,在网上传的数据,这是网格目前的基本形态。

  我们为何需网格和云计算,Internet的应用特点大家都知道了,一个是多样性,不管手持、服务器、桌面、大型机、巨型机都有,多种多样。动态性也很明确,系统要跟着变化,怎么适应变化、控制变化,你是少数点变还是大家都要变,这是Internet下面要解决的问题。异构是我们必须面对的,因为不可能统一硬件。移动性也是现在随着无线通讯、各种各样的新的应用出现,我们要支持若干个应用,同时要解决服务数据的随时随处可访问。这些都是Internet的特点,也就是我们引出了网格和云计算。

  Internet尺度的信息基础设施比较易于控制,可以演化,适应异构。若成为Internet所必须具有的特征,云(如阿里云)计算提供了这样的可能性。比如刚才刘院长讲到,当前主要的云计算的形态还是在云里面,数据在用户端。将来下一步也可能很快就会演变到服务的程序和数据都在云里,也就是说,云就变成了你应该可以比较容易的管理,比较容易的控制,也比较容易演化的机制,而非每一个用户各异的,大家自己来做。所以相对集中的数据中心比较容易控制动态的变化,比较容易控制异构性,这是云计算应对Internet的特点演变出来了。

  关于云计算技术的本质到底是什么我讲到了,有一些虚拟机的概念,有服务概念。所以我们需思考,Web解决了什么?我们80年代做了很多网络互操作,要想互操作,互通互联互操作都费了十分大的事情,还要立项搞。Web出现之后没有了,Web提出了一种协议,来传送你所需处理的数据和程序,提出了一种概念,把数据和处理数据的程序一起传送,这些东西到哪执行,到虚拟机平台执行,就是这么简单的事情。他把你要处理的对象和处理的工具在网上传送,在通用的平台中执行,这就是Web,Web做来做去做了这样的事情。

  我们看云计算目前在干什么?提出把你应用的程序联通操作系统放在云里,执行的时候就激活他,但是他的基础是云必须支持这样的不同的操作系统、运营环境,因此虚拟机的概念就有了。今天在异构性方面,我们把虚拟机加上镜象封装执行构成了云计算基本应动异构的办法,这种办法是否在网络上的普通办法呢?这值得我们考虑。

  我还想跟刚刚热门过的技术比较一下,现在的云计算很像2002年那时候的Grid计算机,Grid主要是居和分布的资源,通过虚拟组织提供高层次的服务,比如分布协同支持资源的使用。云计算现在实际上可看到,目前的商业化的东西,资源相对集中,可控制。以数据中心的形式提供对底层资源的共享使用,并没有太多的强调虚拟组织的概念,这是从资源聚合和使用的方式。

  所以有一种说法,这两方面有一些差别的,另外网格是用聚合资源主要目的是支持挑战性的应用,这是初衷。之所以从高性能计算演变出来是资源不够用,要把分散的资源聚合起来。后来到了2004年以后,逐渐强调适应普遍的信息化应用,特别在中国,做的网格跟国外不太一样,就是强调支持信息化的应用。云(如阿里云)计算一开始就支持广泛的企业界运算、Web应用等等。

  在对异构性方面,理念上有所不同,Grid是用中间件评定异构性,让用户看到的是一样的东西,降低使用的困难,把困难留在中间件,让中间件完成任务。云计算实际上承认异构,我认为是这样,用镜像执行,或提供服务的机制来解决异构性的问题。当然不同的云计算系统还不太一样,像Google一般用比较专用的自己的内部的平台来支持,你要用Google必须采用他的应用方式。

  但我觉得,在异构性处理方面,这两者理念不同,一种是屏蔽异构性,一种是承认异构性。云计算更强调持有持久性应用,通常是企业应用Web应用所需要的。因为有这样的特点,很多用户可考虑把自己的一部分IT基础设施托付给云,实现给自己的业务在云里托管和外包。另外Grid到目前为止主要用户还是科研用户,商业虽然开始有但并不是那么普及,主要是商业运行模型还不够清晰。而云计算的系统,从开始时就以商业运行的形式出现,所以在商业运用模式方面有一些可操作的方案,包括存储、计算等等。

  这两者有一定的区别,但是从根本上来说,从应对Internet的应用的特征特点来说,他们是一致的,为了完成在Internet情况下支持应用,解决异构性、资源共享等等问题。但是出发点和做法不同,他们两者有没有可能取长弃短。比如Cloud是以大量的集中控制管理的资源运行千千万万分散的服务,我觉得基本上是一种大量或若干自己能集中控制管理资源应对千千万万分散的应用。而Grid恰恰是从另外一个角度,从聚合分散的资源,支持大量的相对集中的应用。这两个在理念上还是有点不同,若这两者结合起来,我们是否可聚合大量分散的资源,支持各种各样的大型集中应用及分散的应用,这两个在这点上我觉得还是有互补的地方。

  我觉得在云计算技术方面,我个人觉得有几点,第一是安全,没有安全没人信任你,要想作为公共基础设施没人信任你。第二是标准化,不能再走中间件的老路,我们搞中间件就是为了解决异构性,所以标准很重要,大家要按照某一个标准做。第三是开源,封闭的来走,也许是比较困难。我们有什么机遇呢?我们还要把握Internet的应用和云计算的本质的东西,比如说我们可从国家大的应用系统入手,这样比较容易控制,比较容易操作,用新的技术来促进国家观念性应用系统建设。

  云计算不管是网格计算还是云(如阿里云)计算,或将来我们更广泛的计算,它这种应用模式会使得传统的操作系统发生变化。觉得在这点上,虽然我们国家再搞重大的专项,要搞基础软件,但是我们要看到这里有一些新的发展。有可能使得我们传统的操作系统成为Internet下的系统很小的一部分。这种状态是不是会改变我们竞争格局,开辟新的竞争领域,同时也可能有利于国产的系统软件和应用软件的推广。

  第三我觉得还是实质性的研究,目前来讲,我觉得还有很多问题很肤浅,需要实质性的研究。云计算不应该是一个框,要把所有东西都放在里面。我觉得现在作为政府部门要积极引导,看一些实质性的东西,而非跟着炒概念。