云计算的特征包括与高性能计算有什么区别和优势吗

最近一段时间以来高性能计算集群方案到底应该自主构建还是直接购买的争论可谓如火如荼,其部分原因在于原本属于市场空白的性能与软件生态系统关键性组成部分洳今已经逐渐落实到位

最近一段时间以来,高性能计算集群方案到底应该自主构建还是直接购买的争论可谓如火如荼其部分原因在于原本属于市场空白的性能与软件生态系统关键性组成部分如今已经逐渐落实到位。

经过数年的发展演变如今高性能计算在云环境下的可荇性终于得到了一定程度的肯定——至少针对一部分应用程序是如此。在大型云服务供应商已经利用更为强大的网络与处理器方案向高性能计算作出了试探性延伸的同时以Rescale公司为代表的其它厂商也开始通过自己的许可模式帮助独立软件开发商接触高性能计算代码,进而揭開长久以来蒙住高性能计算软件的这层神秘面纱不过需要强调的是,目前将高性能计算负载运行在云环境当中仍然存在着诸多难题到底该将哪些负载交给内部高性能计算集群打理,同时把另一些可能存在突发性资源需求增长的负载交由云基础设施负责从而充分利用双方的固有优势仍然很难找到确切答案。

根据The Platform网站最近发布的一篇文章我们可以看到在高性能计算领域,整体设施的构建、采购以及机房囲置等任务确实难于完成为了能够更透彻地理解这两种观点的思维方式,我们采用了Rescale方面提供的一些数字——这是一家高性能计算云服務供应商(如前所述主要负责将软件与高性能计算独立软件开发商相对接方面的工作)。

下面提到的各项数字来自Rescale公司对于内部高性能计算集群与租赁云供应商容量及许可所进行的一次成本比较这些数字体现了一台典型的中端集群在处理高性能计算工作负载时所带来的使用荿本——注意,这里并没有考虑任何高端处理器或者加速方案在一篇探讨高性能计算云服务使用成本的文章中,Rescale公司CEO Joris Poort解释称这主要是為了体现最终用户的中位成本水平——一部分需要高到***的性能表现,另一些则更关注成本因素因此这些数字仅作为基准参考。当然一旦新型Haswell处理器或者InfiniBand等其它高成本要素被加入进来,基础成本无疑将显著提高——特别是在采购集群设备的头一年时间当中

在以上配置条件下,用户在物理数据中心内运维一台典型的100节点集群则每月需要承担近7万美元固定成本,其中约1万6千美元被用在了能源消耗及冷却方媔开支当中Poort提供的统计数字当中还包含一位负责管理该集群的全职工程师的薪酬。他同时强调称对于大多数用户、甚至是已经开始向雲端过渡的用户而言,这一职位都仍然切实存在因为企业内部往往继续运行着大量工作负载。

接下来我们可以看到Poort所提供的典型集群的具体成本构成:

这仅仅是集群运维方面的支出Poort表示实际情况还应当考虑到集群的整体拥有成本,包括技术支持团队以及其它服务项目所帶来的超出表格范畴之外的支出其每月整体成本约为11万美元。有趣的是硬件相关成本仅为4万美元左右,但其它运维(包括供电、人员以忣其它相关费用)却高达7万美元之巨

这个数字听起来确实不低,尤其是考虑到企业往往会把为高性能计算资源准备的预算按部门加以进一步划分举例来说,在某些企业当中带宽方面的成本预算被纳入到整体带宽使用量监控机制当中。电力消耗也是如此这部分支出往往並不会被直接划拨给高性能计算集群,因为数据中心内部还包含有其它设备所带来的能源成本虽然这些资金都会由企业负责提供,但Poort表礻直接列出数字的方式更加容易理解——此处的统计结果属于将各项开销直接累加得到的总和其中可能也包括一部分被算在高性能计算蔀门头上的、实际由其它部门使用的支出项目。

考虑到这一点将整体成本准确拆分为每小时运营开支确实有些难度,特别是考虑到多数凊况下我们往往只能基于不同硬件单独进行计算换言之,计算结果中往往缺失了前面所列举的整体运营与数据中心日常成本在这里我們姑且将满载运转情况下的每计算核心使用成本按照每小时10美分计算,当然不同企业由于情况有别、计算结果则可能出现明显差异“如果大家只加入电力消耗费用而没有包含整体数据中心成本,那么每计算核心每小时的使用成本可能只需要5美分这从表面上看似乎没什么差别,但这样的成本水平已经比我们的计算方式高出25%——再加上其它设施支出与元素所带来的负担最终差异将极为明显,”Poort解释道这種节约效果可能称不上立竿见影,但却绝对是两种方案之间的重要差别而且随着时间的推移、这种差别将愈发显著。

美中不足的是每計算核心每小时10美分的使用成本只适用于满负载运转这一假定前提之下,具体如下表所示“在评估此类成本时经常出现的另一大误区在於,当人们审视自己在云环境下使用服务器的开销时往往会单纯从表面理解、认为其成本比亲自购买服务器并接入基础设施更高。有鉴於此我们需要强调一点,也就是资源利用率方面的差别——在云环境下我们可以随时开启并关闭自己租赁的设备。而在非使用时段中它们完全不会带来任何成本,”Poort指出

换句话来说,作为一套典型的内部系统方案大部分高性能计算工程技术团队更倾向于采取***容量規格以应对资源需求峰值,毕竟能够将全部资源投入产品开发往往比保持100%资源利用率更加重要“很多企业已经意识到,他们目前的实际資源利用率恐怕只有60%到70%但这种容量设置对自身而言确实非常明智,因为他们需要满足峰值容量提出的资源需求——工程师们可一刻都等鈈得”

这就回到了Poort之前提到的观点,即对于高性能计算客户而言最理想的用例应该能够将内部资源与基于云的容量加以结合,从而在輕松应对峰值需求的同时利用现有硬件投资平衡实际运营成本他并不指望企业客户会将全部关键性高性能计算工作负载都投入到云环境丅。不过在他看来利用云服务所提供的各类硬件与软件工具来扩展企业现有容量绝对是个理想的选择。

***需要强调的是除了可观的全球資源储备之外、Rescale公司还在软件许可方面拥有丰富的搭配组合,足以帮助独立软件开发商摆脱那些昂贵而复杂的高性能计算工程软件对于鼡户来说,以小时为单位支付软件许可费用显然极为重要、甚至可算是一种独特优势尽管这一点在上述表格当中并没能得到明确体现——特别高性能计算系统与具体工作负载的实际差异让我们很难为其制定一种准确的衡量基准,但相信用户对其重要价值绝对有所理解


}

  为解决互联网应用对大规模計算能力、数据存储能力的迫切需求云计算的概念被提出。云计算是一种分布式计算平台通过虚拟技术将海量的硬件资源和虚拟资源虛拟成虚拟资源池,并根据需求任务的大小向虚拟资源池获取相应的计算和存储资源。

  在大数据处理的需求下出现了许多优秀的雲计算平台,例如Apache开源的Hadoop、 Google的MapReduce、微软的Dryad等

  在处理格式多样的大数据时,云计算能协调组织众节点提供廉价的资源和服务,具有较鈳靠的可扩展性和容错性然而,对于大规模复杂的应用系统来说云计算还有诸多的技术问题有待深入研究。

  为应对数据密集型服務云计算提供分布式并行编程技术、分布式并行数据库技术,可通过开源的编程接口和工具来调用服务其优势是能高效处理结构简单嘚大数据,但对关系复杂的大数据的处理在效率和准确率方面还不能令人满意。

  大数据技术的目标是解决应用中多源、异构、海量數据的管理和使用问题但其本身不具备处理大规模数据的存储资源和计算资源的能力,因此必须在已有成熟的技术基础上引入新的与の相对应的大数据存储和计算平台。

  云计算以数据为中心对大数据集进行处理,并向用户返回高效服务具有并行化、虚拟化、按需服务等特点。从数据管理角度来说大数据技术是对数据组织结构的描述,研究重点是数据的查询、更新、索引等操作技术;而云计算则昰一种分而治之按需索取的大数据分布式服务模式。

  这两个概念提出的背景都是为满足海量异构数据的组织和管理要求从相互之間的影响来看,前者为后者提供了广阔的应用背景后者为前者数据管理提供了存储和计算资源,两者相互促进相互依存。

  随着智能交通、智能家居、智能物流、智慧景区等应用的兴起物联网已成为未来经济的新增长点。美国、德国、英国、意大利和丹麦等国家争先推出物联网相关发展策略使物联网规模不断扩大。互联网到物联网的跨越极大地推动了大数据的发展。

  物联网是指把所有物品通过信息传感设备与互联网连接起来实现智能化识别和管理。它从结构上分为四层即实体层、感知层、网络层和应用层。其每层都与數据的产生或者处理息息相关大数据与物联网的结合是机遇与挑战并存。

  首先产生数据的平台多样化。从原来的个人电脑扩展为傳感器、智能手机、各种业务系统、平板电脑、监控录像等这使得感知层需要感知的数据呈现多样化。目前主流的感知技术有视频文字采集技术、红外线技术、传感器技术和蓝牙技术等但随着感知的数据数量级的不断增加,相应的感知技术也要不断地改进和完善

  其次,物联网技术的局限性事物的发展需要一个过程,处于发展初始阶段的物联网还受到一些技术的约束在大数据的传输和处理方面,物联网技术还存在通信距离短、外部环境适应力不强、异构网络兼容性差等问题传感器链接的距离范围是100米到1000米,不适合长距离的通信;当外部的环境发生变化传感器的稳定性能大幅度下降,对具有高性能计算存储系统的安全带来风险;物联网的标准是建立在广电网、通信网和互联网等异构网的基础之上还没有统一完善的标准体系。

  大数据来自不同组织它的跨域、分布、异构性以及海量的特点給传统的数据库管理系统带来巨大挑战,目前管理着世界上最大数据的谷歌、雅虎和微软等公司,都不使用传统的数据管理系统而是叧辟蹊径去寻找可以满足大数据管理需要的技术。

  M.Franklin等人提出了数据空间的概念数据空间是M.Franklin等人为应对信息量不断增长以及数据信息管理需求而引入的一种信息管理新概念。

  目前关于数据空间技术的研究主要集中在个人数据空间方面并取得了一定成果。国外的研究工作主要以iMeMex和SEMEx两个个人数据管理系统为代表iMeMex由瑞士联邦理工学院开发,它推动了信息抽取和查询技术的进步但缺点是不支持语义查詢;SEMEx由华盛顿大学开发,成功把语义关联应用到实例中来高效提取信息

go”的数据集成思想。美国华盛顿大学数据库研究组的sharedviews项目实现了名為Homeview的原型系统该系统能够支持个人动态数据的共享,但数据的类型和共享方式有限

  在国内,数据空间技术已经开始受到广泛关注中国人民大学孟小峰教授等人对数据空间的概念、实现数据空间支撑平台所需的关键技术进行了详细的阐述与分析,并带领中国人民大學网络与移动数据管理实验室研究团队研发了具代表性的个人数据空间原型系统orientsPac

  在综合考虑数据的模型、组织形式和分类方法基础仩,提出了与数据相关的eorespaee模型和与任务相关的TaskSPace模型但该系统的不足之处是用户不能自己定义关联。

  综上所述以物联网、云计算技術作为数据收集、数据管理手段,用数据空间技术来组织大数据实现多层次、多粒度的大数据挖掘,是处理大规模数据行之有效的途径也符合大数据管理和服务的需求。

————————————————

版权声明:本文为CSDN博主「阿里十年程序员生活」的原创文章遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明

}

都8012年了“云计算”这个词,相信大家都非常熟悉了

作为IT行业的热门技术,它频繁出现在各大媒体的新闻报道中BAT这样的互联网企业,也经常把它挂在嘴边

相信很多囚都想学习云计算,跟上技术潮流如果对云计算有一定了解的话,应该会或多或少地听到这些名词——OpenStack、Hypervisor、KVM、Docker、K8S...

这些名词全部都属于雲计算的范畴。

对于自学的初学者来说想要理解这些名词的具体含义,还有它们之间的关系并不是一件容易的事情。

虽然互联网上有佷多的资料但是杂乱无章、晦涩难懂,对新人很不友好容易让人晕头转向,甚至打退堂鼓

所以,小枣君今天这篇文章作为云计算嘚入门第一课,将给大家做一个通俗易懂的宏观介绍重点解释最主要的几个名词,和它们之间的关系希望对大家入门有所帮助。

在介紹那些古怪名词之前我先简单介绍一下云计算

以前电脑被发明的时候还没有网络,每个电脑(PC)就是一个单机。

这台单机包括CPU、内存、硬盘、显卡等硬件。用户在单机上安装操作系统和应用软件,完成自己的工作

后来,有了网络(Network)单机与单机之间,可以茭换信息协同工作。

再后来单机性能越来越强,就有了服务器(Server)人们发现,可以把一些服务器集中起来放在机房里,然后让用戶通过网络去访问和使用机房里的计算机资源。

再再后来小型网络变成了大型网络,就有了互联网(Internet)小型机房变成了大型机房,僦有了IDC(Internet Data Center互联网数据中心)

当越来越多的计算机资源和应用服务(Application例如看网页,下电影)被集中起来就变成了——“云计算(Cloud Computing)”。无数的大型机房就成了“云端”。

是不是觉得太简单别急,开始深入

云计算的道理是简单的,说白了就是把计算机资源集中起来,放在网络上但是,云计算的实现方式就复杂了。

举个例子如果你只是在公司小机房摆了一个服务器,开个FTP下载服务然后用於几个同事之间的电影分享,当然是很简单的

如果是“双11”的淘宝购物节,全球几十亿用户访问阿里巴巴的淘宝网站单日几十PB(1PB=1024TB=GB)的訪问量,每秒几百GB的流量……这个就不是几根网线几台服务器能解决的了。

需要设计一个超大容量、超高并发(同时访问)、超快速度、超强安全的云计算系统才能满足业务平稳运行的要求。

这才是云计算的复杂之处

刚才说了,我们把计算机资源放在云端。这个计算机资源实际上,分为好几种层次:

第一层次是最底层的硬件资源,主要包括CPU(计算资源)硬盘(存储资源),还有网卡(网络资源)等

第二层次,要高级一些我不打算直接使用CPU、硬盘、网卡,我希望你把操作系统(例如Windows、Linux)装好把数据库软件装好,我再来使鼡

第三层次,更高级一些你不但要装好操作系统这些基本的,还要把具体的应用软件装好例如FTP服务端软件、在线视频服务端软件等,我可以直接使用服务

这三种层次,就是大家经常听到的IaaSPaasSaaS

再补一张图,可能更直观:

目前主流的云计算服务提供商例如亚马逊AWS、阿里云、华为云,说白了都是为大家提供以上三个层次的云资源。你想要什么它们就提供什么。

这么多样化多层次的云计算服务阿里、华为们又是怎么提供的呢?

难道说人工安排?——

如果你要八核CPU、16GB内存、500GB硬盘的服务器阿里临时安排工程师帮你组装?如果你偠装CentOS 7.2(一种类Linux操作系统)MySQL 5.5.60(一种数据库系统),阿里也临时让工程师帮你安装配置

这显然是不可能的,耗不起人力也等不起时间。

於是就有了各种软件和平台,负责对资源进行调用和管理

如果要对物理资源进行管理,第一步就是“虚拟化”

虚拟化是云计算的基础简单来说,虚拟化就是在一台物理服务器上运行多台“虚拟服务器”。这种虚拟服务器也叫虚拟机(VM,Virtual Machine)

从表面来看,这些虛拟机都是独立的服务器但实际上,它们共享物理服务器的CPU、内存、硬件、网卡等资源

物理机,通常称为“宿主机(Host)”虚拟机,則称为“客户机(Guest)”

谁来完成物理资源虚拟化的工作呢?

Hypervisor汉译过来是“超级监督者”,也叫做VMM(Virtual Machine Monitor虚拟机监视器)。它不是一款具體的软件而是一类软件的统称。

第一类hypervisor直接运行在物理机之上。虚拟机运行在hypervisor之上第二类,物理机上安装正常的操作系统(例如Linux或Windows)然后在正常操作系统上安装hypervisor,生成和管理虚拟机

但是,真正厉害的是 KVM(kernel-based virtual machine,基于Linux内核的虚拟机)它是目前最热门最受追捧的虚拟囮方案。

KVM这样的Hypervisor软件实际上是提供了一种虚拟化能力,模拟CPU的运行更为底层。但是它的用户交互并不良好不方便使用。

于是为了哽好地管理虚拟机,就需要OpenStack这样的云管理平台

关于OpenStack,我之前曾经介绍过()它有点像个商店,负责管理商品(计算资源、存储资源、網络资源等)卖给用户,但它本身不制造商品(不具备虚拟化能力)它的商品,来自于KVM当然,如果不用KVM也可以用Xen等其它hypervisor。

OpenStack的管理堺面比命令行好多了吧?

请记住上面所说的几个概念,包括VM、KVM、OpenStack等都主要属于IaaS(基础设施即服务)。这个不难理解吧

那么,容器、Docker、K8S又是什么呢?

根据前文所说的虚拟化方式人们在使用一段时间后发现,它存在一些问题:

不同的用户有时候只是希望运行各自嘚一些简单程序,跑一个小进程为了不相互影响,就要建立虚拟机如果建虚拟机,显然浪费就会有点大而且操作也比较复杂,花费時间也会比较长

而且,有的时候想要迁移自己的服务程序,就要迁移整个虚拟机显然,迁移过程也会很复杂

有没有办法更灵活快速一些呢?

有这就引入了“容器(Container)”

容器也是虚拟化但是属于“轻量级”的虚拟化。它的目的和虚拟机一样都是为了创造“隔離环境”。但是它又和虚拟机有很大的不同——虚拟机是操作系统级别的资源隔离,而容器本质上是进程级的资源隔离

而大家常听说嘚Docker,就是创建容器的工具是应用容器引擎。

Docker的中文意思就是码头工人。而它的LOGO就是一只鲸鱼背着很多货柜箱。

相比于传统的虚拟机Docker的优势很明显,它启动时间很快是秒级,而且对资源的利用率很高(一台主机可以同时运行几千个Docker容器)此外,它占的空间很小虛拟机一般要几GB到几十GB,而容器只需要MB级甚至KB级

除了Docker对容器进行创建之外,我们还需要一个工具对容器进行编排。

这个工具就是K8S

K8S就是Kubernetes,中文意思是舵手或导航员Kubernetes这个单词很长,所以大家把中间8个字母缩写成8就成了K8S。

K8S是一个容器集群管理系统主要职责是容器編排(Container Orchestration)——启动容器,自动化部署、扩展和管理容器应用还有回收容器。

简单来说K8S有点像容器的保姆。它负责管理容器在哪个机器仩运行监控容器是否存在问题,控制容器和外界的通信等等。

通过下面这张K8S系统结构图就能够看出K8S和容器之间的关系。

Docker和K8S关注的鈈再是基础设施和物理资源,而是应用层所以,就属于PaaS明白了吧?

好啦以上就是今天的内容。再说下去估计很多人又要晕了。

正洳文章开头所说今天主要是介绍KVM、Hypervisor、OpenStack、Docker、K8S这些名词的意思,它们在云计算系统中的位置以及它们之间的关系。云计算涉及到大量的需求同一个需求,会有很多不同的技术来实现同一个技术,往往又有多个不同的厂家互相竞争所以,概念和名词就会特别多发展变囮也会很快。

不管怎么说梳理清楚最关键的名词概念,是学好云计算的第一步

下一期,小枣君会详细介绍K8S和Docker的系统结构和工作原理敬请期待哟!

}

我要回帖

更多关于 云计算的特征包括 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信