当前位置:首页 > 原创 > 刘岩轩
[导读]“云原生”一词最初来自Matt Stine在2013年写的一本书——《Migrating to Cloud-Native Application Architectures》,书名中的Cloud-Native即是“云原生”的由来。

“云原生”一词最初来自Matt Stine在2013年写的一本书——《Migrating to Cloud-Native Application Architectures》,书名中的Cloud-Native即是“云原生”的由来。

但云原生并不是一种从零出发的创新技术,而是由云服务的发展而来。从2006年亚马逊云科技推出Amazon S3和Amazon EC2服务以来,云服务随着客户业务的需求不断发展。到2013年云原生的概念提出,到现在2022年,我们认为云原生的时代已经到来。

云服务从一开始的定义就是一种服务,既然是服务就是围绕着客户的业务需求为中心的。同样的云原生也不是为了云原生而去云原生,要迈入云原生的背后原因还是客户业务的发展需求使然。例如,亚马逊云科技上构建的90%的服务都是基于客户的需求,其他10%的创新则是为客户进行发明创造的服务,这即是云服务商贯穿始终的服务创新理念。

云原生是2022年亚马逊云科技中国峰会上最多被提到的词之一,这也是云服务发明之后的又一次重要的发展进程。从数据中心原生、到云好奇、云友好,一直到现在的云原生,客户的既存业务经过了迁移和改造阶段。而现在要构建一个新的行业应用或者应用转型,云原生是最佳的选择,也是具有长远的发展价值的必然选择。

本文根据刚刚结束的2022年亚马逊云科技中国峰会上的精彩分享,从云原生应用构建、云原生数据挖掘、云原生背后关键技术三个角度来展示亚马逊云科技的云原生服务全貌。


云原生应用构建:不止是会用云服务工具,要实现DevOps流程改造

“云原生应用架构的关键在于需要充分运用更高级别的云服务,来实现开发人员工作效率、业务敏捷性、资源利用率等提升。”亚马逊云科技大中华区战略业务发展部总经理顾凡分享到。而这些高级别的云服务,正是亚马逊云科技在过去的16年间,持续不断地创新的结果,让云服务全面迈向Serverless。

据亚马逊云科技全球副总裁、大中华区执行董事张文翊分享,Amazon DynamoDB、Amazon Lambda、Amazon Fargate等一些列的云服务都堪称“改变游戏规则的创新”。现在亚马逊云科技的Serverless计算及容器服务多达9个;数据库服务多达6个;数据分析多达7个。

从客户的角度而言,要构建云原生的应用,仅仅有这些颠覆性的云服务工具用起来是不够的,还需要改造其开发流程和运营模式。亚马逊云科技总结了一套从应用迈向云原生之旅的经验,包括构建、治理和迭代三个阶段、九个步骤,在每个步骤亚马逊云科技都有相应的云服务、最佳实践去赋能亚马逊云科技的用户。

构建包括三个步骤:

第一步,构建弹性应用架构,用Amazon EKS将应用做容器化改造,对单体应用做微服务拆解,去用好Amazon EKS 用好Amazon Lambda,去搭建一个弹性应用的架构。第二步,一切皆代码。通过CDK去实现基础设施即代码,把云中的资源管理自动化,去提升运维效率。第三步,持续交付。利用Amazon Code Pipeline去搭建一个自动化发布的流水线,用App Mesh去控制应用自动交付的网络流量,保证新功能安全稳妥的发布。

治理同样包含三个步骤:第一步,可观测性是治理微服务的关键。采用亚马逊云科技托管的Amazon Prometheus服务,配合ADOT可以全面监控系统的运行状况。第二步,选择云原生数据库,当把一个单体应用拆分为多个微服务的时候,为微服务选择最适合的云原生数据库,让整个应用的整体架构做到弹性和敏捷。第三步,Amazon DevSecOps,安全团队和开发和运营团队一定要集成,避免安全成为流水线中的一个瓶颈,可以用Amazon Inspector持续扫描软件的漏洞。

在迭代阶段也包含三个步骤:第一步,持续部署,在代码自动进入到生产环境之前,去用亚马逊云科技 FIS去运行一个故障注入实验,能够更好地改进应用程序的性能。第二步,一切皆服务,将平台级的一些服务(像数据库 消息传递总线、API网关等)公开为一个共享服务,供其他人使用,用Amazon EKS Blueprints去构建一个基于Amazon EKS的共享服务平台。第三步,持续迭代、运维,利用亚马逊云科技Well-Architected Tool不断地去改进系统结构。


云原生数据战略:解决“数” “智”结合挑战

IDC预测仅在2022年,人类就将创建超过97ZB的数据;历史上到2012年为止人类生产的所有印刷材料的数据量仅为200PB;仅仅是2022这一年人类所创建的数据量的50万分之一。

如果将数据保存在1TB的硬盘上面,100PB的硬盘连着摆放起来,约等于2000米,也就是一亩农田的一个周长。而存放97ZB数据量的硬盘连着摆放起来,是地球与月球距离的2.5倍。所以说从200PB到97ZB是从“一亩农田”到“星辰大海”的距离。

然而数据量的增加并不等于数据价值的增加,埃森哲最近的一个调研发现 ,有68%的组织认为他们仍无法获取数据带来的价值。

成为数据驱动型企业并不容易,构建数据驱动型组织面临着诸多挑战。譬如:企业没有一个明确的数据战略;高速增长的数据带来了高昂的数据存储和分析成本;企业难以找到发挥数据价值的场景;在数据治理、监管过程中保证数据安全等等。

在亚马逊云科技中国峰会首日的主题演讲中,张文翊分享的六大云技术趋势中,其中一条即“打破传统的数据管理局限,数据库走入云原生时代”。而顾凡也分享了亚马逊云科技的云原生数据战略——“三个支柱和一个基石”,如何帮助客户通过数据驱动智能创新。

云原生数据战略第一个支柱就是要采用原生数据基础设施来存储和处理数据。

在2004年12月,由于关系数据库Oracle无法支持亚马逊云科技快速增长的业务规模,因此亚马逊电商网站在高峰期出现了几个小时的中断,这让亚马逊的工程师重新去思考,应该如何去设计底层的数据存储,从而研发出了非关系型的数据库Dynamo。随后在2012年,也就是10年前,Amazon DynamoDB服务进而正式发布。

现在Amazon DynamoDB已经广为应用,亚马逊云科技一直在不断完善不同类型的数据库和分析服务。为了让客户快速实现传统数据库向Amazon DynamoDB的迁移,亚马逊云科技推出了Amazon Babelfish工具,让传统数据库的应用代码尽量不改就可以直接运行在Amazon Aurora上,将迁移的时间从数月、数年减少到几周。

Amazon Aurora专为云平台打造,是用户数量增速最快的云服务之一,与MySQL及PostgreSQL全面兼容,吞吐量是标准MySQL的5倍、标准PostgreSQL的3倍,成本却只有传统数据库的十分之一。从Amazon Aurora Severless V1、 V2再到去年re:Invent发布的Amazon Redshift/Amazon EMR/Amazon MSK的Serverless版本,客户采用Serverless的数据库和分析服务更容易自动扩容,成本更加地灵活。

云原生数据战略的第二个支柱是智能湖仓2.0架构,在打破数据孤岛,实现数据一体化融合分析的智能湖仓1.0的基础上,进一步增强了数据分析和人工智能之间的联动能力。

当前大数据和机器学习融合管理面临着不小的挑战,因为企业的算法模型和数据通常是两个团队,所以当模型走向实际应用时,需要大量数据训练时,算法团队没有很好的大规模数据处理的能力,有时候要花大量的精力才能搞明白如何去获取和处理数据。

智能湖仓2.0就是解决客户的数据和AI融合的挑战。

首先,所有用来做数据预加工的数据分析服务现在都有了无服务器版本,可以让工程师只专注于数据处理的代码效率和质量。

其次,为大数据和算法团队提供统一的数据治理底座,来解决两边在数据的发现和理解各自为战的问题,比如通过Amazon Lake Formation再加上Amazon Glue Catalog,将各种分析引擎和Amazon SageMaker的数据目录打通,同时提供唯一的数据检索入口和统一的数据访问授权。

第三,用好Amazon SageMaker Studio的新功能,让算法团队在一个统一的界面下可以访问数据加工和模型开发调试的工具,让算法团队能够充分利用大数据团队,在数据处理方面已经取得的成果直接去用,避免重复造轮子。比如大数据团队已经在Amazon EMR上开发好的Spark代码,比如在某个数据集里面已经存在Amazon Redshift数仓里面,只需要在大数据团队的代码上加一句SQL做很小的转换便可以供机器学习模型使用。

云原生数据战略的第三大支柱是通过机器学习,重塑创新引擎。

第一步是帮助客户找到合适的业务场景,例如通过个性化推荐提高转化率、运用机器视觉进行身份验证等。在第一步的基础上,第二步就是要通过开箱即用的AI SaaS服务快速地去验证机器学习是否能解决问题。亚马逊云科技 AI SaaS模型覆盖了文档处理、机器视觉、聊天机器人、搜索、推荐、语音、呼叫中心等7个横向领域,以及工业、医疗健康、代码开发等3个垂直领域。

在第一步和第二步都完成之后,第三步就是要解决机器学习的产业化挑战。亚马逊云科技提供支持所有主流机器学习框架的基础设施和丰富的加速器实例;通过Amazon SageMaker等工具降低机器学习开发难度,并且将机器学习开发的流程融入到Ops中, 实现端到端的机器学习自动化。

第四步就是在产业外,更高的层次上,赋能更多的人去构建机器学习的应用,通过高校合作、竞赛、可视化工具等角度来实现机器学习的普及。

在以上云原生数据战略的三个支柱下,离不开的是“安全”这个基石。要实现数据安全就要有有效的数据治理的手段。数据治理并不简单是一个技术问题 ,更是一个人员流程和技术的组合。亚马逊云科技提供全生命周期的数据治理结构,帮助客户解决数据安全挑战。例如通过Data Mesh数据网格,解决企业全球数据安全合规和支持本地创新两者兼得的需求。


云原生背后的底层芯片技术:真正改变云服务游戏规则的能力

一系列云服务的背后,离不开关键的底层技术的支持。张文翊表示,亚马逊云科技带来的发生在底层的、实打实的创新是真正的颠覆性的创新,拥有改变游戏规则的能力。顾凡表示,亚马逊云科技拥有计算的两大创新引擎:Amazon Nitro系统和自研芯片,这是探索新一代云技术架构的关键技术。

Amazon Nitro作为亚马逊云自研的底层核心系统,已经在过去的近十年时间里发展到了第五代。Nitro系统将云计算资源底层的网络、存储、安全控制等功能,从服务器卸载到Amazon Nitro专用芯片上运行,服务器的计算资源能完全服务于客户的工作负载。配合一个轻量级的Hypervisor,Nitro的虚拟化引擎所占用物理服务器的系统资源不到1%,几乎可以忽略不计,而传统虚拟化占用物理服务器的系统资源通常会高达30%。

从2017年开始,Amazon EC2新实例的研发速度大幅地提高,这都得益于Amazon Nitro系统的迭代升级。

自研芯片是亚马逊云科技的另一个重要底层技术。得益于Annapurna实验室的加持,亚马逊云科技从2013年开始自研芯片,拥有完整的芯片产品布局:第一条线是刚刚提到的Amazon Nitro,第二条线是用于机器学习推理和训练的芯片Amazon Inferentia和Amazon Trainium,第三条线是基于ARM架构的CPU Amazon Graviton。

2018年,亚马逊云科技发布了第一款基于ARM的自研芯片Amazon Graviton,2019年发布Amazon Graviton2,去年发布最新一代的Amazon Graviton 3。Graviton2的性能比第一代Graviton提高了7倍;Graviton3比Graviton2的性能进一步提高多达25%,能耗却降低了60%。Graviton持续的迭代,证明亚马逊云科技已经步过了自研芯片的早期陡峭学习曲线。

对于云服务厂商而言,自研Arm芯片不是目的,目的是要有一系列能够跑在之上的云服务。亚马逊云科技已经有超过20多种基于Amazon Graviton 2的托管服务,用户无需重编译便可直接享受Amazon Graviton 2的高性价比和低功耗。

除了Graviton系列外,亚马逊云科技自研了面向机器学习推理和训练的加速芯片Amazon Inferentia和Amazon Trainium,将云端训练和推理推向最极致的性价比:

Trn1实例:Amazon EC2实例支持多达16颗Amazon Trainium加速芯片,是在云端最快的深度学习实例,Trn1上运行的Hugging Face BERT大模型性能对比GPU的实例有42%提升,成本降低了54%;

Inf1实例:Alexa已经大规模的在使用Inf1,国内某社交媒体客户将自己的计算机视觉(CV)和自然语言处理(NLP)等五个模型也部署到了Inf1上面,相比GPU的实例,吞吐量扩大3倍。而成本降低了60%。

基于Amazon Inferentia的Amazon EC2 Inf1 计算实例已在西云数据和光环新网运营的中国区域落地。

除了上述的自研芯片,赛灵思的FPGA、英伟达的GPU、英特尔Habana Gaudi和亚马逊云科技自研的Amazon Trainium和Amazon Inferentia、四大厂商的各种加速卡,亚马逊云科技加速计算的产品家族已经全面覆盖。无论是CPU+GPU,CPU+FPGA,还是与量子计算机的异构,亚马逊云科技都能够提供相应的加速计算服务。

亚马逊云科技构建了完整的量子计算生态环境,包括了亚马逊云科技上的量子服务Amazon Braket,量子实验室以及量子计算中心。Amazon Braket以API的形式让客户轻松访问量子计算机和模拟器,方便用户去构建模型的时候同时使用到经典计算和量子计算资源。

总结

云服务的真正目的是赋能行业客户,实现应用创新。亚马逊云科技是云服务的“探路者”,也是其它行业中“探路者”型企业的赋能者,为行业客户提供行业特定的解决方案和跨行业通用的解决方案。不论是EV、自动驾驶、双碳还是元宇宙,新的行业应用构建都从云原生开始,在云上发展。而传统行业应用在转型阶段,迈入云原生也是必经之路。

亚马逊云科技作为云服务的发明者,透过十多年的云服务技术积累,以及与客户多年的密切合作,已经构建了完整的云原生的服务体系。在当下这个时间节点,借助亚马逊云科技的完整云原生服务,云原生正在发生,并且将会以更高的成长速度发展。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

双方的合作促成了尖端人工智能视觉解决方案,提高了效率、连通性和成本效益

关键字: 人工智能 智能家居 机器学习

轻量级AI定制模型助力低成本快速部署 北京2024年4月18日 /美通社/ -- 数据和人工智能(AI)领域的领先者SAS—今日在SAS Innovate大会上首次展示了一款变革性的、旨在帮助企业直面业务挑战的解决方案...

关键字: SAS AI模型 人工智能 INNOVATE

【2024年4月24日,德国慕尼黑讯】英飞凌科技股份公司(FSE代码:IFX / OTCQX代码:IFNNY)发布全新PSOC™ Edge微控制器(MCU)系列的详细信息,该系列产品的设计针对机器学习(ML)应用进行了优...

关键字: 物联网 机器学习 MCU

四月的上海,生机盎然繁花盛开。备受瞩目的“CHINAPLAS 2024 国际橡塑展”今日拉开帷幕,将一连四天(4月23 - 26日)在国家会展中心(上海)盛装绽放。展会规模空前,展商数量历史性地攀升至4,420家,相比2...

关键字: 新能源汽车 锂电技术 人工智能

创新打造云生态,共创智慧新未来

关键字: 人工智能 云实验室

TDK株式会社(东京证券交易所代码:6762)新近推出InvenSense SmartEdgeMLTM解决方案,这是一种先进的边缘机器学习解决方案,为用户提供了在可穿戴设备、可听戴设备、增强现实眼镜、物联网 (IoT)...

关键字: 机器学习 物联网 传感器

眼下,人工智能不仅能辅助科学研究与艺术创作,还能实现自动驾驶、打造“无人农场”和“黑灯工厂”,成为解锁新质生产力的关键钥匙。

关键字: 人工智能 AI 无人农场

随着科技的飞速发展,人工智能已经逐渐走进我们的生活。从智能手机到自动驾驶汽车,人工智能正不断改变着我们的日常体验。然而,这只是科技革命的一个起点。

关键字: 人工智能 AI 自动驾驶

在人工智能的快速发展中,加强AI监管与推动AI技术的进步同等重要。从技术角度来看,可以通过可解释AI等技术手段增强AI的可信度。

关键字: 人工智能 AI 增强AI
关闭