跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • MySQL 单表三千万条数据,怎么优化 count 查询?
未分類
2 10 月 2020

MySQL 单表三千万条数据,怎么优化 count 查询?

MySQL 单表三千万条数据,怎么优化 count 查询?

資深大佬 : CodeXx 1

innodb,20 来个字段,每天有几十万条数据插入,在不做分表的情况下,怎么优化查询?现在是 count 查询很慢,5s 左右,带上查询条件比如近一个月就更慢了 10 多 s

大佬有話說 (46)

  • 資深大佬 : Joyboo

    分区,索引

  • 資深大佬 : lidashuang

    可以不做 count,就不做
    非做的话,看看能不能自己统计

    或者放 es 里?

  • 主 資深大佬 : CodeXx

    @Joyboo 索引对 count 查询貌似没用,还是得扫描全表

  • 主 資深大佬 : CodeXx

    @lidashuang 分页查询用到的,也不知道会用什么条件查询

  • 資深大佬 : huntcool001

    每天晚上把到零点的数据库的数据,离线做分析统计,count+各种查询条件等等(大概 es 或者其他框架,我不是很清楚), 结果存起来.

    然后每天的数据,你有了当天零点以来的 binlog,就有了增量的 count. 和离线分析做出来的 count 结合起来.

    大概是这个思路. 大厂都是这么干的.

  • 資深大佬 : RickyC

    如果数据库不经常改变
    根据查询条件建立几个 count 表, 里面保存根据各种条件得到的 count 数字;
    并给 count 表建立索引

    这样也许行

  • 資深大佬 : RickyC

    接上
    如果你每天还有 10w 的数据更改, 可以在每次更改的时候修改 count 表.

    我觉得用 count 表可能解决你的问题. 预先统计

  • 資深大佬 : egglin

    异构吧,es + mysql

  • 資深大佬 : maigebaoer

    如果直接 count,用 count(*)吧,没啥特别好的建议。要不就直接入库前统计,写 count 字段。

  • 資深大佬 : mrhhsg

    三千万的 count 那还不是一瞬间的事?加内存就完了

  • 資深大佬 : v2orz

    插入的时候维护 count 信息?同 9L

  • 資深大佬 : Leigg

    不要做实时查询即可,延迟个 30s 几分钟,数量到达一定高度后,多数场景中的实时统计就变成了一种伪需求,如果一定需要,换数据库,比如 clickhouse

  • 資深大佬 : RangerWolf

    12 +1,clickhouse 的统计非常

  • 資深大佬 : dongisking

    这问题我这边也遇到过,特别是做管理后台特别多复杂的条件做 where 的 count 根本无法缓存,最后的解决办法是把 count 缓存,然后页面显示“大约 xx 条”,每一段时间更新一次

  • 資深大佬 : cccy0

    近实时统计的话建议放 es

  • 資深大佬 : sagaxu

    @CodeXx 索引 count 时有没有用,要看区分度,你索引类似性别这种低区分度的当然没用

  • 資深大佬 : liuzhaowei55

    不要使用 count,如果是 id 自增而且没有删除数据可以使用最后一条数据的 id,或者使用 explain 返回的 rows,这个值不太准但响应很快

  • 資深大佬 : nomansky

    加个表,里面保存 count,每插入一条数据更新 count

  • 資深大佬 : haohappy

    count 慢 select 不慢吗

  • 資深大佬 : dzdh

    @CodeXx 分页场景的话,where 排序字段 >上一页的最大值 limt x, n

  • 資深大佬 : juntao

    最近有遇到,多字段 WHERE 查询,1kw 条不到,不想分表
    1 做好索引。可以用 EXPLAIN 来帮助优化。 — 有一定效果
    2 限制查询的时间范围 — 特别有效
    3 异构,mysql,redis 、elasticsearch 等等单独统计数据, 因为 2 能够满足我们的需求,所以没采用。

    @liuzhaowei55 直接获取自增 id 也是一种方法诶。之前没考虑,需要匹配场景。

  • 資深大佬 : fuyufjh

    mysql 8.0 有 parallel query,能大幅提升这个场景

  • 資深大佬 : zakokun

    1. 索引对 count 有用
    2. 几千万的表 count 需求来自哪里?为何要每天 count
    3. 维护一个 count 表,插入数据的时候更新 count 表
    4. ES

  • 資深大佬 : hooopo

    @dongisking pg 可以这么搞 https://twitter.com/Hooopo/status/1292836409640751106?s=19

  • 資深大佬 : j747677392

    如果都是日志型的数据(用于分析,没删改的话) 可以用 hdfs+imapla,支持 sql,几亿数据查询毫秒吧

  • 資深大佬 : wangyzj

    count 和索引没关系
    es 是个选项
    或者单独做个统计信息表
    或者用 redis 来分页

  • 主 資深大佬 : CodeXx

    @RickyC
    @maigebaoer
    @v2orz
    @Leigg
    @RangerWolf
    这样只能存总的 count 吧,查询有其他条件的更慢,14 这种差不多

  • 主 資深大佬 : CodeXx

    @haohappy select 很快

  • 資深大佬 : cokolin

    能否首先描述一下为何要 count,例如页面查询需要总量,还是什么需要

  • 資深大佬 : cokolin

    还有查询用到的字段是否是固定的,如果的固定的话,是否可以增加索引,看看 EXPLAIN 分析用到的索引是否正确
    另外也可以用一些业务的方式避免分页查询总量的

  • 資深大佬 : xsm1890

    myisam 自动维护总数,count 的过程不用计算只需要度数即可

  • 資深大佬 : raysmond

    如果只是 count,且对实时性要求那么高(能接受 10s ?),有个很简单的做法能大幅提高速度
    用一个线程异步 count 就好,用的地方直接从内存取,对使用方来说超级快

  • 資深大佬 : fangcan

    不要求精确的话 用 explain

  • 資深大佬 : Evilk

    如果是分页用的 count,如果数据量太大,我一般给个模糊值
    每隔段时间,更新一次,即可

  • 資深大佬 : liwl

    是想弄图表吧 每天 count

  • 資深大佬 : rickiey

    mongoDB shared cluster 不行吗? 我没用过

  • 資深大佬 : lshero

    OLAP 的功能交给别的数据库做吧

  • 資深大佬 : mofeishiwo

    https://time.geekbang.org/dailylesson/detail/100056822

  • 資深大佬 : megatron7

    没有数据断层吧并且有自增主键索引可以用:
    select max(id) from table;

  • 資深大佬 : bbao

    @CodeXx mysql 是行锁,是否全表需要看你后面 where 条件。

  • 資深大佬 : ragnaroks

    做个同步的从库,统计类需求从从库查,不影响主库业务

  • 資深大佬 : vus520

    1,能不 count 就不 count
    2,Mysql 有触发器,能不能插入的时候写到其它某个 value 上
    3,缓存神器你值得拥有

  • 資深大佬 : liyunlong41

    加索引应该也要扫描索引树吧。
    插入的时候更新 count,似乎会影响插入效率。
    将数据同步到其他数据库例如 es 或者从库,查询从这些里面查好像不错。
    定时任务周期性的计算 count 也可以,查询时直接用结果,也是有一定的时延。

  • 資深大佬 : everhythm

    1.索引 or 各种缩小量级的方法对 count 有效,所以最近一个月的 count 你可以优化

    2.来吧业务查询中间件,把 query 拆分为若干 subquery,再分发到不同实例,最后汇总,但是到这一步已经快超出 rds 范畴了,查询速度还不能接受的话考虑其他方式

  • 資深大佬 : lidashuang

    @CodeXx 分页查询用 我之前都是去掉 count

  • 資深大佬 : xuewuchen

    索引吧。。。LAST ID

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具