近日受邀参加首届《PolarDB 开发者大会》,这也国内数据库厂商越来越重视生态建设的表现,特别是数据库主要的受众-开发者,他们的声音对产品的发展至关重要。在本次会议上,阿里云重磅发布了中国首款自研云原生数据库 PolarDB 的“三层分离”全新版本,基于智能决策实现查询性能10倍提升、节省50%成本。同时面向开发者,阿里云全新推出数据库场景体验馆、训练营等系列新举措,广大开发者可率先免费体验 PolarDB 数据库核心特性及NL2BI等AI新功能。下文是个人对参与本次大会的一点感受。
1、PolarDB 发展总览
作为国内最早定义的一款“云原生”数据库,PolarDB 发展已历经十五年,从早期基于开源数据库的深度优化,到结合云原生技术并形成独立品牌对外发布,到提供多种版本形成品牌矩阵,再到率先提出 Serverless 化并再次开源。PolarDB 一路走来,见证了国产数据库发展的不平凡之路。现在 PolarDB 正朝着更智能、更经济、更优化、更便捷的方向继续发展。
作为一个品牌族,PolarDB 其实是由多款产品组成,主要分为集中式、分布式两个系列;包括有高度兼容 MySQL 的 PolarDB-M、高度兼容 PostgreSQL 和 Oracle 的 PolarDB-PG及分布式版本 PolarDB-X。用户可以根据自身业务场景、生态兼容要求等进行选择。
此次发布会的一个重要观点,就是希望向开发者表达 PolarDB 的发展理念,并通过一个比喻-搭积木来形象描述。其通过产品四个方面的加强,来达到这一目标。一是云原生化,即加速数据业务上云,通过一种新的资源交付方式简化开发者使用数据库;二是平台化,即通过云平台的一站式功能帮助开发者使用和管理好数据库;三是一体化,即通过多场景打通,优化使用体验可实现如“单体”般的使用效果;四是智能化,即通过产品内置 AI 能力,可让数据库一方面变得更加智能简化管理,一方面提供更友好交互的可能。
针对云原生化,PolarDB 推出了业内首创的三层分离形态,即对数据库资源层(CPU、MEM、DISK)实现了全部分离,即较以往提供更细粒度的资源管控能力,其带来的优势就是可实现根据不同工作负载搭配不同的资源配置,进而实现最优成本产出比。
在 CPU 方面,PolarDB 实现多角色转化及向上扩展能力,提供了非常灵活的组合使用方式。
在 MEM 方面,PolarDB 实现了内存全局复制,这样是达到业务更加平滑的效果。能做到这点也是依赖于阿里云多年在底层硬件的优化功力。
在存储方面,PolarDB 内置的分布式存储系统 PolarStore,通过日志优化、RDMA 高速网络等措施实现低成本下的读写延迟优化。
一体化方面,PolarDB 的软硬一体方案,通过在存储、网络、内存等多项硬件领域创新,实现最优费效比。
Serverless,作为近年大火的热点,已成为云厂商发力的重点,其对于用户的敏态业务具有非常好的实用价值。PolarDB 通过智能决策系统可实现基于负载感知的向上或向外扩展能力,进而满足用户突发业务压力。结合内核提供的热备、事务重连、全局内存等技术,实现弹性条件下的业务无感。
本次大会智能化上还有个小亮点,通过一个小朋友带来的联机互动,演示与数据库通过自然语言交互的使用体验。虽然来略显简单,但其未来发展潜力非常大。其核心正式利用了当今大火的大模型技术。
在谈到 PolarDB 分布式版本之前,会上先提出了使用分布式数据库的三个核心问题:必要性、兼容性和成本。一是必要性,即是否有必要使用分布式数据库。对于中小规模用户而言,分布式数据库还有些遥远,但当面临业务发展时又不得不经历从集中式到分布式的痛苦过程。PolarDB 给出的答案是“单机分布式一体化”,即两种架构一套内核,可实现平滑扩展升级,打消用户使用分布式的担心。
二是兼容性,即使用分布式是否能做到业务无感,这也是阻碍分布式数据库推广的核心问题,很多用户会担心分布式下很多使用难点。PolarDB 给出的答案是“自动分片与扩展资源平衡”,通过灵活分片调整方式打消用户对使用分片的恐惧心理。
三是成本,即分布式下面临的海量数据管理与多工作负载可能带来的成本提高。PolarDB 给出的答案是“冷热分离与查询事务一体化”来解决。
此次大会还分设几个分论坛,就开发者关心的问题进行讨论。个人有幸受邀参与一场分论坛,内容是《面向未来,开发者需要什么样的数据库?》,与几位行业大咖进行了一次思想的碰撞。下面就几个论坛讨论有意思的问题分享下部分观点。