咨询个 hbase 的订单路由问题
資深大佬 : Ministor 5
假设某个公司的订单 10 年达到 100 个亿的数据,存在 hbase 里面
1.创建一张表,散列到 100 个分区,rowkey 是按照 userid 进行散列
2.创建 10 张表,每个表有 10 个分区,这 10 个表是按照订单的创建时间每年来划分的,rowkey 是按照 userid 进行散列
1.创建一张表,散列到 100 个分区,rowkey 是按照 userid 进行散列
2.创建 10 张表,每个表有 10 个分区,这 10 个表是按照订单的创建时间每年来划分的,rowkey 是按照 userid 进行散列
如果用方案 1,那么这张表会不会显得大,因为最近一年的订单访问会比较频繁,一年前的数据访问不那么频繁,有没有那种浪费的感觉
如果用方案 2,最近一年那个表会不会出现热点问题,可以把一年前的订单用机械磁盘存,最近一年用 ssd 存储,保证 99rt,且降低成本
目前存在的疑惑就是 方案 2 会不会出现热点问题,因为方案 1 的话,感觉会路由到不同的分区,会减少热点的概率
对 hbase 还不是太熟悉,求指教一下
大佬有話說 (0)