云原生数据系统的设计思考 译文

2023-02-20
关注

​译者 | 卢鑫旺

审校 | 孙淑娟

在设计云原生数据系统时,并没有特定的托管基础设施、编程语言或者设计模式。构建云原生系统有多种多样的方式。让我们来看一看云原生架构应该牢记的设计原则,以及一个优秀的云原生平台具备哪些特征。

一、云原生架构

云原生架构本质上是使用云构建应用程序的设计模式。虽然没有具体的方法来实现这种架构或预定义的云原生设计,但最常见的方法是将应用程序分解为几个微服务,让每个微服务处理不同类型的功能。然后,每个微服务都由一个小团队维护,通常作为容器部署。

让我们来进一步看看云原生架构。

二、拥抱微服务

云原生设计和开发依赖于松耦合的架构,应用程序的不同部分独立开发,独立操作,独立部署,通常使用微服务实现。

可以肯定地说,微服务是云原生系统的基础。通过使用容器,可以将运行时环境及其库、二进制文件和依赖项压缩为有逻辑且易于管理的单元,从而从中受益。因此,应用程序服务可以根据需要存储、复制、传输和使用。

与单体程序不同,微服务由一个个小而独立的服务组成

微服务(或者说松耦合架构)对云计算非常重要。原因有几个,例如它提升了服务的简单性、可扩展性和弹性。让我们来进一步看看这是如何实现的。

使用这种架构,你可以将复杂的应用程序分解为独立的小的模块,使应用程序的开发周期变得简单且易于管理。分离应用程序配置和基本代码也使开发和维护应用程序更加容易。同样,保持核心应用程序与支持服务的分离允许代码库按照自己的速度发展和扩展。

此外,伸缩一个应用程序的各个部分比伸缩整个整体应用程序更容易(也更快)。同样,更新应用程序更容易,因为你只需要更新需要更改的部分(或微服务),而不是再次部署整个应用程序的新更新版本。

拥抱微服务也增加了弹性,使应用程序更加可靠。例如,如果微服务架构中的一个组件发生故障,整个应用程序不会崩溃。它还促进了IaC(代码即基础设施),这反过来为自动化部署铺平了道路(我们稍后将介绍)。最后,微服务架构涉及通过API使用无状态进程和组件,将每个微服务与其他服务隔离,从而提高安全性和效率。

为了确保应用程序遵循松耦合的体系结构,必须避免在不同部分之间形成紧耦合的依赖关系。例如,两个微服务不应该依赖于同一个数据库。如果他们这样做了,你将无法独立更新和操作它们。

三、代码即一切

虽然使用微服务从现代应用程序中受益很重要,但采用自动化实践也很重要。这旨在优化应用程序开发过程,使开发人员和用户都受益。为此,最终目标是实现EaC — 代码即一切。因此,将EaC视为IaC的领先一步,这里说的IaC包括应用程序代码库、基础设施和平台。

这种方法在硬件和软件方面都有许多好处。例如,它有助于在各个级别实施版本控制,并改善部门间的协作。它还促进了不同组件的模块化,并通过及时更新帮助防止漏洞来增强安全性。

云原生数据系统的一个关键方面是使用CI/CD工具在不同级别实现自动化的能力。通过采用DevOps和敏捷原则,你可以得到一些好处,例如更低的运营成本、更好的安全性、更灵活、可扩展性和快速的开发周期。

安全尤其重要。手动处理通常会导致对云原生平台的攻击,但通过自动化实现最佳安全实践可以提高安全性。此外,CI/CD中的SecDevOps允许你在SDLC的早期阶段执行安全测试,以便可以在开发阶段早期处理漏洞。

四、API优先的思考方式

开发人员通常专注于代码优先的开发方式,而不是API优先,但问题是这种方法不是开发现代应用程序的最佳方法。对于云原生数据系统,我们应该鼓励开发人员采用API优先的思考和开发方式,并在此基础上构建软件。这样做有助于在为现代分布式应用奠定基础时节省大量时间和精力。

正如我们前面提到的,云原生数据系统应该遵循微服务架构,其中应用程序的服务是分开的,每个服务都作为一个自主应用程序执行。因此,微服务依赖于API来相互通信和交互。

请记住微服务架构和现代应用程序的流行,API的重要性是显而易见的。此外,API优先的原则也让开发人员获得了微服务模式的所有好处。遵循API优先方法的应用程序可以被视为紧密联系的服务的生态系统,其中来自应用程序的调用和用户界面的调用,它们被视为API消费者。

这种方法有许多优点。例如,它使系统具有高度的可扩展性,并减少了失败几率。它还降低了开发成本,改善了开发体验,并通过加快开发过程加快了上市速度。除了通过API促进用户和应用程序之间的通信之外,它还促进了内部流程的自动化和通信。

五、云原生设计原则

云原生应用通常遵循12要素应用框架中定义的原则,并围绕安全性、弹性(和可用性)、弹性和性能(包括可扩展性)构建。让我们进一步了解这些云原生设计原则。

1.可扩展性

可伸缩性背后的理念是,可以为应用程序和相关服务添加额外的容量,以应对需求和负载的增加。特别是,在设计可扩展性时,应考虑每个应用程序层、如何扩展以及如何避免瓶颈。

在这种情况下,需要考虑三个关键领域:容量、负载和数据。

关于容量,请考虑是否需要扩展各个层,以及是否可以在不影响应用程序可用性的情况下进行扩展。你还需要考虑扩展服务的速度,以及是否可以在不影响运营的情况下在业务服务外的时间缩减应用程序的部署规模。

当涉及到数据时,请考虑是否可以扩展,同时要记住服务的限制,如事务吞吐量和数据库大小。然后,找出如何在保持平台约束的同时对数据进行分区以进一步提高可伸缩性。同样,你需要弄清楚如何高效地使用平台资源。

在负载方面,你需要确定如何改进设计以避免瓶颈,以及如何在流量高峰时使用异步操作来帮助负载平衡。你还需要探索如何使用所选平台的不同速率均衡和负载平衡功能。

确保可扩展性的一种方法是创建自动化流程,以便在需要时扩展、修复和部署系统。您可以设置系统以生成有意义的日志(以及事件),然后将其用作不同自动化活动的挂钩。生成的系统应该能够自动调配基础设施,如机器实例,构建、测试和部署CI/CD管道中的不同阶段,并处理动态可扩展性和运行状况监视和备份。

许多人认为云原生系统应该是无状态的,但这在现实应用中很难实现。由于在分布式应用程序中很难管理状态,所以最好尽可能使用无状态组件。这是因为无状态组件使负载平衡、扩展、修复和回滚更加容易。

2.可用性

可用性是指如果底层操作系统、硬件、网络依赖性或应用程序本身出现了故障,系统仍能对消费者可用的能力。重要原则包括性能、正常运行时间、灾难恢复和备份。

当涉及到性能时,你需要定义可接受的性能级别、如何衡量它们,以及当性能低于可接受级别时应触发的操作或事件。你还需要确定应用程序中最可能导致问题的部分,以及以队列为中心的设计或自动缩放是否有助于解决问题。此外,你需要弄清楚使云原生系统的某些部分异步是否有助于提高性能。

正常运行时间保证也很重要。特别是,你需要定义产品应满足的SLA,以及你选择的云服务是否可能满足这些SLA。同时,在灾难恢复方面,你需要确定在发生故障时如何重建云原生系统,以及在这种情况下可以承受多少数据损失。最后,还需要确定在发生故障时如何处理备份、运行中队列和消息,并确定要将镜像存储在何处以及是否有备份。

最后,在复制方面,你需要确定系统中存在高故障风险的部分以及受故障影响最大的部分。此外,确定是否需要数据副本以及如何防止不可靠数据的副本带来的影响。

3.安全性

云原生数据系统中的安全性是一个非常广泛的话题,涉及很多方面。首先,但也最重要的是,你需要了解以下内容:

保存数据的所在地的当地法管辖区和法律,包括保存度量和故障切换数据的国家/地区

如果是混合云应用程序,如何保护云和企业网络之间的链接

是否能够满足联邦安全的要求

如何控制对云提供商管理门户的访问、处理密码更改以及限制对数据库的访问。

如何处理云供应商和操作系统安全更新和修补程序

4.可管理性

可管理性是指了解系统性能和运行状况以及管理操作的能力。关于云,我们必须考虑两个原则 — 部署和监测。

当涉及到部署时,需要问自己一些问题。例如,考虑如何实现部署的自动化,以及如何在不中断实时系统的情况下修补或重新部署。此外,考虑如何检查部署是否成功,以及在部署失败时如何回滚。同样,部署还包括确定需要的环境数量以及它们需要多少存储和可用性。

同时,对于监控方面,你需要计划如何监控应用程序(打算使用现成的服务还是从头开始开发?)以及将监控数据物理存储在何处。你还需要确定监控计划将产生的数据量,以及如何访问度量日志。类似地,问问自己是否能够承受丢失一些日志数据,以及是否需要在运行时更改监控级别。

5.可行性

最后,可行性包括在时间和预算限制的情况下维护和交付系统。这一原则需要考虑的一些事项是:

  • 是否可以满足SLA?例如,是否有云提供商可以保证需要向客户提供的正常运行时间?
  • 是否拥有构建云应用程序所需的内部经验和技能,或者需要将其交给第三方?
  • 要在收益和成本之间权衡,维持云提供商复杂定价的同时能接受的花费

六、一个优秀的云原生数据平台具备的特征

你已经知道了在创建云原生平台时应该考虑的原则和架构考虑因素。现在让我们来看看一个好的平台应该提供哪些更多的功能。

1.成本效益

完全托管管理的云服务和内部部署/自我管理的服务的成本确实存在很大差异。然而,前者的弹性和大多数云平台遵循的按使用付费模式,使得可以在没有任何资源(成本以及)浪费的情况下运行适当的规模。

这也意味着你无需担心为未使用的资源支付额外费用,甚至无需处理容量规划。此外,由于云平台的多租户,服务提供商可以以比自管理服务低得多的成本为其服务定价。

2.为你所用的付费

如上所述,大多数云平台都遵循按使用量付费模式,这意味着你只需为所使用的资源付费,而不必为所提供的资源付费。这些资源既可以是高级的(如API请求),也可以是底层的(如内存或CPU使用)。因此,与本地数据的情况不同,你不需要为可能根本不使用的许可核心付费。

2.弹性和和扩展性

一个好的云原生平台还包括可以通过简单的API调用或点击来扩大或缩小服务规模。如果平台能够根据定义的策略自动扩展服务,那就更好了。此外,由于预管理容量规划和弹性扩展,只有在最极端的情况下才会暴露可扩展性限制。

4.可用性

高效的云原生平台还由其高可用性定义,并设计用于处理大多数故障。例如,大多数平台提供至少99.95%的服务水平协议,这意味着一年最多只会有4.5小时的停机时间。不过,在现实中,你可以要求更高的可用性。

5.多租户

多租户有两个好处 — 可管理性和规模经济性 — 大多数云原生服务都从中受益。首先,你可以使用S3这样的服务为客户提供最佳的用户体验,S3将服务作为查询或请求而不是CPU提供。所有租户都被隔离得很好,以至于用户不知道同一个物理系统也为其他租户服务。

是的,在某些情况下,用户必须购买专用计算资源,如内存和CPU(AWS Aurora就是这样)。然而,底层基础设施(如存储和网络)仍然是共享的。

6.性能优化

最后,为了能够服务不同类型的客户工作负载,你的系统应该在多个维度上可扩展。应在整个基础架构(包括硬件、操作系统和应用程序)中调整和优化约束条件。此外,在管理系统的情况下,应该有一个紧密的生产反馈机制。系统还应能够分析和学习不同的可扩展性和性能相关事件,并推出改进以优化性能。

原文链接:https://dzone.com/articles/design-considerations-for-cloud-native-data-system

译者介绍:

卢鑫旺,51CTO社区编辑,编程语言爱好者,对数据库,架构,云原生有浓厚兴趣。​

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

提取码
复制提取码
点击跳转至百度网盘