曹操出行创立于 2015 年 5 月 21 日,是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务,以“科技重塑绿色共享出行”为使命,将互联网、车联网、自动驾驶技术以及新能源科技,创新应用于共享出行领域,以“用心服务国民出行”为品牌主张,致力于打造具有优质服务口碑的出行品牌。
作为一家互联网出行平台,曹操主要提供了网约车、顺风车和专车等多种出行服务。其中,打车是核心业务之一。整体业务过程大致如下:首先,用户在我们的平台上下单,然后曹操平台会给司机进行订单的派发,司机接到订单后,会进行履约服务。结束一次订单服务后,乘客会在平台上进行支付。
在整个流程中,涉及到的数据将会在业务系统中流转,主要包括有营销、订单、派单、风控、支付、履约等。这些系统产生的数据存储在 RDS 中,并进一步流入实时数仓中进行分析和处理。最终数据会进入到不同的使用场景中,比如实时的标签,实时大屏、多维 BI 分析,还有实时业务监控以及实时算法决策。
面对曹操出行不断增长的数据生产成本和研发需求,传统 Lambda 架构已无力支撑现有业务,并呈现以下痛点:
基于 Hologres 实现数据的高并发更新
市面上主流的数据湖产品通常采用 LSM(Log-Structured Merge)架构,主流数据主键模型更新模式有 CopyOnWrite 和 MergeOnRead。这两种场景都有各自的问题:CopyOnWrite 具有写放大的问题,数据的延迟会比较高;MergeOnRead(读时合并)模式在读取数据时需要进行大量的数据合并操作,因此读取性能可能较差。
Hologres 的存储架构采用分布式存储系统,并在其上构建了存储引擎。在底层,Hologres 使用了分布式存储系统来管理数据的存储和分布。存储引擎包括一些关键组件,如 Block Cache、Shard。每个 Shard 中包含了多个 Tablet 和 Write-Ahead Log(WAL)。在 Hologres 中,行存使用 MergeOnRead 方式,列存采用 MergeOnWrite。
在 MergeOnWrite 模式下,一条数据进入 Hologres 时,首先到达 WAL Manager(Write-Ahead Log 管理器),同时也会进入到 Memtable(内存表)。在 Memtable 中,主要存储三类数据:数据文件、删除标志文件(例如基于 RoaringBitmap 的文件)和索引文件。当 Memtable 数据积累到一定阶段后,会生成不可变的 Memtable,并通过异步线程定期将其刷新(flush)到 Data File(数据文件)中。通过这种架构,Hologres 能够兼顾行存和列存的优势,并通过适当的数据合并策略来提高性能和存储效率。
Hologres 还支持 Binlog,Binlog 也是一种物理表,其跟原表的主要区别是内置的几种自身结构,包含自身递增序列,数据修改类型以及数据修改时间,Binlog 本质上也是分 shard 进行存储,所以也是一种分布式表,并且在 WAL 之前生成,因此在数据上可以与原表保证强一致性。
此外,Hologres Binlog 修改类型也还原了 Flink 中的四种 RowKind 类型。在数据更新过程中会产生两条更新记录(update_before,update_after),并且保证了更新记录是连续的存储。
基于阿里云 Hologres 的实时数仓实践
1.实时数仓架构设计
2.dwd 宽表构建实践
Hologres 列更新能力能很好地实现宽表 Join。在整个生产过程中,还需重点关注维表的应用场景,其应用场景包含几种情况:一种是维表是不变的,或者缓慢的变化,另一种是维表频繁变化的。为了保证数据最终的一致,通常的设计是像离线的方式去构建一个维表拉链的数据,通过 Start Time 和 End Time 的方式去存储维度状态有效的一个周期。
其次需要关注维表延迟问题。在实际生产过程中,维表链路与主表的链路通常是异步的,可能会出现维表延迟导致主表关联数据为空或关联到过时的维度状态。为处理这种情况,需要在 Hologres 中实施维度缺失记录的过滤,并采取补偿机制进行维度补偿处理。同时,还需要定时调度进行维度字段和维表对比检查,以增量方式修正不一致的维度状态。
3.聚合计算场景优化
针对许多预聚合计算场景,统一收敛到 Rollup 计算模型中,主要解决以下问题:在 Flink 聚合场景中经常会出现状态兼容性的问题;数据复用性非常差的问题,例如研发人员收到需求需要新增指标或者维度粒度时,为了不影响生产数据的稳定性,新增需求需要构建新任务,导致任务管理混乱。
针对上述问题,曹操出行主要进行了两点优化:
结合这两点,把已有的指标放入 map 结构中进行封装,这样在不改变原有的算子状态,也可以得到很好的处理。在下游中可以针对不同维度组合,指标集合做好选择,然后由同步工具做实时的数据路由,为下游提供服务。
4.链路中吞吐能力调优
整个流链路中吞吐能力的调优主要涉及两个部分:
5.元数据血缘的改造
曹操出行主要采取以下措施来进行元数据血缘的改造:
6.搭建链路保障体系
在日常开发过程中,对于任务健康以及任务出现异常后的判断和检测,都是通过异常检测诊断工具去做支持。主要体现四个方面:
在链路保障体系中,全链路的感知能力是非常重要的。曹操出行主要通过流量监控和延迟监控来实现全链路的感知能力:
通过任务上下游生产速率比,以及任务自身延迟情况,在整个生产链路中可以快速定位出具体异常和问题发生的节点,以便及时处理和优化,提高系统的性能和稳定性。
7.建设数据订正能力
在传统的 Streaming 链路中,数据订正方案一直是个复杂工程,主要涉及以下两个方面的挑战: