节点深耕

云原生落地:从工具堆栈到工程协同

本文聚焦云原生落地的真实阻力:工具过载、协作断层与价值难量化,并给出以 API 优先与数据驱动为核心的工程化思路。

2024-01-01约 2 分钟阅读
#node #DevOps

云原生已经从概念期进入落地期,但不少团队仍停留在“引入工具”阶段。工具数量在增长,交付效率却未必同步增长。

  • 平台多:云平台、容器平台、开发平台、运维平台
  • 工具多:编程语言、框架、中间件、数据库、缓存、消息队列
  • 概念多:敏捷、DevOps、GitOps、AIOps
  • 人员多:开发、测试、运维、安全、数据、产品、运营
  • 业务多:SaaS、订阅制

云原生的目的

云原生的价值观是希望让软件开发、测试、运维更加高效、快速、安全、可靠。但落到不同的公司,这个目的就有所不同了:

  • 有的公司希望通过云原生来提升研发效率 —— 推进 DevOps 的落地
  • 有的公司希望通过云原生来提升运维效率 —— 建立 可观测、可治理、可自愈 的运维体系
  • 有的公司希望通过云原生来提升商业效率 —— 采用 SaaS 的商业模式

无论路径如何变化,“降本增效”始终是共同目标。

工程落地的难点

各式工具越来越多,但是工程师们却越来越难以选择。为了扩大市场,这些工具和产品都希望发展成瑞士军刀,能够解决更多的问题来吸引更多的用户。但是,这也意味着工程师们需要花更多的时间来学习这些工具,对比功能和性能、关注更新和漏洞。

在你安装了数百个开源工具后,每一次更新(节点的、集群的、工具的)都是对团队的一种挑战。你必须小心翼翼地检查每一个更新的内容,以确保不会对现有的业务产生影响。

工程化思考

  • API(接口) First

解耦,是防止各种工具野蛮生长的一个方法。如果你的工具都是通过 API 来调用的,那么你就可以随意更换工具,只要新的工具提供了相同的 API。

  • 数据工程和可视化

人类在进行判断时,会借助于经验和直觉 —— 即在过去长时间的工作中所积累下来的记忆。而在更复杂的环境中,一是这种经验和直觉就会变得不够用,二是人力的成本也会变得不够用。

所以数据 —— 机器的记忆,就是非常重要的“经验”来源了。而对于充足的、精确的、标准的数据,借助 LLM 构建出 ChatBot,可以大幅提高工作效率。