当前位置:首页 > 原创 > 刘岩轩
[导读]“云原生”一词最初来自Matt Stine在2013年写的一本书——《Migrating to Cloud-Native Application Architectures》,书名中的Cloud-Native即是“云原生”的由来。

“云原生”一词最初来自Matt Stine在2013年写的一本书——《Migrating to Cloud-Native Application Architectures》,书名中的Cloud-Native即是“云原生”的由来。

但云原生并不是一种从零出发的创新技术,而是由云服务的发展而来。从2006年亚马逊云科技推出Amazon S3和Amazon EC2服务以来,云服务随着客户业务的需求不断发展。到2013年云原生的概念提出,到现在2022年,我们认为云原生的时代已经到来。

云服务从一开始的定义就是一种服务,既然是服务就是围绕着客户的业务需求为中心的。同样的云原生也不是为了云原生而去云原生,要迈入云原生的背后原因还是客户业务的发展需求使然。例如,亚马逊云科技上构建的90%的服务都是基于客户的需求,其他10%的创新则是为客户进行发明创造的服务,这即是云服务商贯穿始终的服务创新理念。

云原生是2022年亚马逊云科技中国峰会上最多被提到的词之一,这也是云服务发明之后的又一次重要的发展进程。从数据中心原生、到云好奇、云友好,一直到现在的云原生,客户的既存业务经过了迁移和改造阶段。而现在要构建一个新的行业应用或者应用转型,云原生是最佳的选择,也是具有长远的发展价值的必然选择。

本文根据刚刚结束的2022年亚马逊云科技中国峰会上的精彩分享,从云原生应用构建、云原生数据挖掘、云原生背后关键技术三个角度来展示亚马逊云科技的云原生服务全貌。


云原生应用构建:不止是会用云服务工具,要实现DevOps流程改造

“云原生应用架构的关键在于需要充分运用更高级别的云服务,来实现开发人员工作效率、业务敏捷性、资源利用率等提升。”亚马逊云科技大中华区战略业务发展部总经理顾凡分享到。而这些高级别的云服务,正是亚马逊云科技在过去的16年间,持续不断地创新的结果,让云服务全面迈向Serverless。

据亚马逊云科技全球副总裁、大中华区执行董事张文翊分享,Amazon DynamoDB、Amazon Lambda、Amazon Fargate等一些列的云服务都堪称“改变游戏规则的创新”。现在亚马逊云科技的Serverless计算及容器服务多达9个;数据库服务多达6个;数据分析多达7个。

从客户的角度而言,要构建云原生的应用,仅仅有这些颠覆性的云服务工具用起来是不够的,还需要改造其开发流程和运营模式。亚马逊云科技总结了一套从应用迈向云原生之旅的经验,包括构建、治理和迭代三个阶段、九个步骤,在每个步骤亚马逊云科技都有相应的云服务、最佳实践去赋能亚马逊云科技的用户。

构建包括三个步骤:

第一步,构建弹性应用架构,用Amazon EKS将应用做容器化改造,对单体应用做微服务拆解,去用好Amazon EKS 用好Amazon Lambda,去搭建一个弹性应用的架构。第二步,一切皆代码。通过CDK去实现基础设施即代码,把云中的资源管理自动化,去提升运维效率。第三步,持续交付。利用Amazon Code Pipeline去搭建一个自动化发布的流水线,用App Mesh去控制应用自动交付的网络流量,保证新功能安全稳妥的发布。

治理同样包含三个步骤:第一步,可观测性是治理微服务的关键。采用亚马逊云科技托管的Amazon Prometheus服务,配合ADOT可以全面监控系统的运行状况。第二步,选择云原生数据库,当把一个单体应用拆分为多个微服务的时候,为微服务选择最适合的云原生数据库,让整个应用的整体架构做到弹性和敏捷。第三步,Amazon DevSecOps,安全团队和开发和运营团队一定要集成,避免安全成为流水线中的一个瓶颈,可以用Amazon Inspector持续扫描软件的漏洞。

在迭代阶段也包含三个步骤:第一步,持续部署,在代码自动进入到生产环境之前,去用亚马逊云科技 FIS去运行一个故障注入实验,能够更好地改进应用程序的性能。第二步,一切皆服务,将平台级的一些服务(像数据库 消息传递总线、API网关等)公开为一个共享服务,供其他人使用,用Amazon EKS Blueprints去构建一个基于Amazon EKS的共享服务平台。第三步,持续迭代、运维,利用亚马逊云科技Well-Architected Tool不断地去改进系统结构。


云原生数据战略:解决“数” “智”结合挑战

IDC预测仅在2022年,人类就将创建超过97ZB的数据;历史上到2012年为止人类生产的所有印刷材料的数据量仅为200PB;仅仅是2022这一年人类所创建的数据量的50万分之一。

如果将数据保存在1TB的硬盘上面,100PB的硬盘连着摆放起来,约等于2000米,也就是一亩农田的一个周长。而存放97ZB数据量的硬盘连着摆放起来,是地球与月球距离的2.5倍。所以说从200PB到97ZB是从“一亩农田”到“星辰大海”的距离。

然而数据量的增加并不等于数据价值的增加,埃森哲最近的一个调研发现 ,有68%的组织认为他们仍无法获取数据带来的价值。

成为数据驱动型企业并不容易,构建数据驱动型组织面临着诸多挑战。譬如:企业没有一个明确的数据战略;高速增长的数据带来了高昂的数据存储和分析成本;企业难以找到发挥数据价值的场景;在数据治理、监管过程中保证数据安全等等。

在亚马逊云科技中国峰会首日的主题演讲中,张文翊分享的六大云技术趋势中,其中一条即“打破传统的数据管理局限,数据库走入云原生时代”。而顾凡也分享了亚马逊云科技的云原生数据战略——“三个支柱和一个基石”,如何帮助客户通过数据驱动智能创新。

云原生数据战略第一个支柱就是要采用原生数据基础设施来存储和处理数据。

在2004年12月,由于关系数据库Oracle无法支持亚马逊云科技快速增长的业务规模,因此亚马逊电商网站在高峰期出现了几个小时的中断,这让亚马逊的工程师重新去思考,应该如何去设计底层的数据存储,从而研发出了非关系型的数据库Dynamo。随后在2012年,也就是10年前,Amazon DynamoDB服务进而正式发布。

现在Amazon DynamoDB已经广为应用,亚马逊云科技一直在不断完善不同类型的数据库和分析服务。为了让客户快速实现传统数据库向Amazon DynamoDB的迁移,亚马逊云科技推出了Amazon Babelfish工具,让传统数据库的应用代码尽量不改就可以直接运行在Amazon Aurora上,将迁移的时间从数月、数年减少到几周。

Amazon Aurora专为云平台打造,是用户数量增速最快的云服务之一,与MySQL及PostgreSQL全面兼容,吞吐量是标准MySQL的5倍、标准PostgreSQL的3倍,成本却只有传统数据库的十分之一。从Amazon Aurora Severless V1、 V2再到去年re:Invent发布的Amazon Redshift/Amazon EMR/Amazon MSK的Serverless版本,客户采用Serverless的数据库和分析服务更容易自动扩容,成本更加地灵活。

云原生数据战略的第二个支柱是智能湖仓2.0架构,在打破数据孤岛,实现数据一体化融合分析的智能湖仓1.0的基础上,进一步增强了数据分析和人工智能之间的联动能力。

当前大数据和机器学习融合管理面临着不小的挑战,因为企业的算法模型和数据通常是两个团队,所以当模型走向实际应用时,需要大量数据训练时,算法团队没有很好的大规模数据处理的能力,有时候要花大量的精力才能搞明白如何去获取和处理数据。

智能湖仓2.0就是解决客户的数据和AI融合的挑战。

首先,所有用来做数据预加工的数据分析服务现在都有了无服务器版本,可以让工程师只专注于数据处理的代码效率和质量。

其次,为大数据和算法团队提供统一的数据治理底座,来解决两边在数据的发现和理解各自为战的问题,比如通过Amazon Lake Formation再加上Amazon Glue Catalog,将各种分析引擎和Amazon SageMaker的数据目录打通,同时提供唯一的数据检索入口和统一的数据访问授权。

第三,用好Amazon SageMaker Studio的新功能,让算法团队在一个统一的界面下可以访问数据加工和模型开发调试的工具,让算法团队能够充分利用大数据团队,在数据处理方面已经取得的成果直接去用,避免重复造轮子。比如大数据团队已经在Amazon EMR上开发好的Spark代码,比如在某个数据集里面已经存在Amazon Redshift数仓里面,只需要在大数据团队的代码上加一句SQL做很小的转换便可以供机器学习模型使用。

云原生数据战略的第三大支柱是通过机器学习,重塑创新引擎。

第一步是帮助客户找到合适的业务场景,例如通过个性化推荐提高转化率、运用机器视觉进行身份验证等。在第一步的基础上,第二步就是要通过开箱即用的AI SaaS服务快速地去验证机器学习是否能解决问题。亚马逊云科技 AI SaaS模型覆盖了文档处理、机器视觉、聊天机器人、搜索、推荐、语音、呼叫中心等7个横向领域,以及工业、医疗健康、代码开发等3个垂直领域。

在第一步和第二步都完成之后,第三步就是要解决机器学习的产业化挑战。亚马逊云科技提供支持所有主流机器学习框架的基础设施和丰富的加速器实例;通过Amazon SageMaker等工具降低机器学习开发难度,并且将机器学习开发的流程融入到Ops中, 实现端到端的机器学习自动化。

第四步就是在产业外,更高的层次上,赋能更多的人去构建机器学习的应用,通过高校合作、竞赛、可视化工具等角度来实现机器学习的普及。

在以上云原生数据战略的三个支柱下,离不开的是“安全”这个基石。要实现数据安全就要有有效的数据治理的手段。数据治理并不简单是一个技术问题 ,更是一个人员流程和技术的组合。亚马逊云科技提供全生命周期的数据治理结构,帮助客户解决数据安全挑战。例如通过Data Mesh数据网格,解决企业全球数据安全合规和支持本地创新两者兼得的需求。


云原生背后的底层芯片技术:真正改变云服务游戏规则的能力

一系列云服务的背后,离不开关键的底层技术的支持。张文翊表示,亚马逊云科技带来的发生在底层的、实打实的创新是真正的颠覆性的创新,拥有改变游戏规则的能力。顾凡表示,亚马逊云科技拥有计算的两大创新引擎:Amazon Nitro系统和自研芯片,这是探索新一代云技术架构的关键技术。

Amazon Nitro作为亚马逊云自研的底层核心系统,已经在过去的近十年时间里发展到了第五代。Nitro系统将云计算资源底层的网络、存储、安全控制等功能,从服务器卸载到Amazon Nitro专用芯片上运行,服务器的计算资源能完全服务于客户的工作负载。配合一个轻量级的Hypervisor,Nitro的虚拟化引擎所占用物理服务器的系统资源不到1%,几乎可以忽略不计,而传统虚拟化占用物理服务器的系统资源通常会高达30%。

从2017年开始,Amazon EC2新实例的研发速度大幅地提高,这都得益于Amazon Nitro系统的迭代升级。

自研芯片是亚马逊云科技的另一个重要底层技术。得益于Annapurna实验室的加持,亚马逊云科技从2013年开始自研芯片,拥有完整的芯片产品布局:第一条线是刚刚提到的Amazon Nitro,第二条线是用于机器学习推理和训练的芯片Amazon Inferentia和Amazon Trainium,第三条线是基于ARM架构的CPU Amazon Graviton。

2018年,亚马逊云科技发布了第一款基于ARM的自研芯片Amazon Graviton,2019年发布Amazon Graviton2,去年发布最新一代的Amazon Graviton 3。Graviton2的性能比第一代Graviton提高了7倍;Graviton3比Graviton2的性能进一步提高多达25%,能耗却降低了60%。Graviton持续的迭代,证明亚马逊云科技已经步过了自研芯片的早期陡峭学习曲线。

对于云服务厂商而言,自研Arm芯片不是目的,目的是要有一系列能够跑在之上的云服务。亚马逊云科技已经有超过20多种基于Amazon Graviton 2的托管服务,用户无需重编译便可直接享受Amazon Graviton 2的高性价比和低功耗。

除了Graviton系列外,亚马逊云科技自研了面向机器学习推理和训练的加速芯片Amazon Inferentia和Amazon Trainium,将云端训练和推理推向最极致的性价比:

Trn1实例:Amazon EC2实例支持多达16颗Amazon Trainium加速芯片,是在云端最快的深度学习实例,Trn1上运行的Hugging Face BERT大模型性能对比GPU的实例有42%提升,成本降低了54%;

Inf1实例:Alexa已经大规模的在使用Inf1,国内某社交媒体客户将自己的计算机视觉(CV)和自然语言处理(NLP)等五个模型也部署到了Inf1上面,相比GPU的实例,吞吐量扩大3倍。而成本降低了60%。

基于Amazon Inferentia的Amazon EC2 Inf1 计算实例已在西云数据和光环新网运营的中国区域落地。

除了上述的自研芯片,赛灵思的FPGA、英伟达的GPU、英特尔Habana Gaudi和亚马逊云科技自研的Amazon Trainium和Amazon Inferentia、四大厂商的各种加速卡,亚马逊云科技加速计算的产品家族已经全面覆盖。无论是CPU+GPU,CPU+FPGA,还是与量子计算机的异构,亚马逊云科技都能够提供相应的加速计算服务。

亚马逊云科技构建了完整的量子计算生态环境,包括了亚马逊云科技上的量子服务Amazon Braket,量子实验室以及量子计算中心。Amazon Braket以API的形式让客户轻松访问量子计算机和模拟器,方便用户去构建模型的时候同时使用到经典计算和量子计算资源。

总结

云服务的真正目的是赋能行业客户,实现应用创新。亚马逊云科技是云服务的“探路者”,也是其它行业中“探路者”型企业的赋能者,为行业客户提供行业特定的解决方案和跨行业通用的解决方案。不论是EV、自动驾驶、双碳还是元宇宙,新的行业应用构建都从云原生开始,在云上发展。而传统行业应用在转型阶段,迈入云原生也是必经之路。

亚马逊云科技作为云服务的发明者,透过十多年的云服务技术积累,以及与客户多年的密切合作,已经构建了完整的云原生的服务体系。在当下这个时间节点,借助亚马逊云科技的完整云原生服务,云原生正在发生,并且将会以更高的成长速度发展。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭