各位大佬,并行的 2 条队列数据怎么做实时融合
資深大佬 : whats 24
背景:
- 有 2 个数据源分别实时向 kafka 两个 topic ( topicA, topicB )写数据,A ,B 数据量日均一千万左右。
- topicA, topicB 数据写入顺序略微不同,理论上 A, B 路数据一一对应,通过唯一 ID 可以关联,实际可能会漏数据,也就是存在一部分关联不上的数据。
需求:
- 需要两个 topic 数据关联上后(都消费到后)再执行后面的操作,且时效性要求较高(因此无法通过离线关联)。
各位彦祖有没好的方案或者工具可以处理这种情况。
大佬有話說 (13)