使用 pymong insert_many 插入数据越来越慢
資深大佬 : dtgxx 10
大佬们,我数据量一共 60 亿,现在插入了 6 亿左右,一开始的时候 每次 insert_many 只需要 0.05 秒 1000 条
目前已经插入 6 亿左右,现在 1000 条数据有时候需要 20 秒,非常的慢。
用什么办法可以调优一下呢?
mongo 是单点的,部署在一台机器上,没有分片和副本。
试过 bulk_write 性能是一样的
大佬有話說 (10)
大佬们,我数据量一共 60 亿,现在插入了 6 亿左右,一开始的时候 每次 insert_many 只需要 0.05 秒 1000 条
目前已经插入 6 亿左右,现在 1000 条数据有时候需要 20 秒,非常的慢。
用什么办法可以调优一下呢?
mongo 是单点的,部署在一台机器上,没有分片和副本。
试过 bulk_write 性能是一样的
几个优化点:
1. 分表( Sharding )
2. 不要创建索引
3. 选择其他技术方案,例如 Hive 、HBase
60 亿条数据,这种量级的数据应该更适合 Hive 或者 HBase 吧,做分布式储存不香么,单点来搞大数据你这不是给自己挖坑么