一千万数据，怎么快速查询？

时间：2023-02-03 09:23:48 来源：哔哩哔哩

前言

面试官：来说说，一千万的数据，你是怎么查询的？

B哥：直接分页查询，使用limit分页。

(资料图片)

面试官：有实操过吗？

B哥：肯定有呀

此刻献上一首《凉凉》

也许有些人没遇过上千万数据量的表，也不清楚查询上千万数据量的时候会发生什么。

今天就来带大家实操一下，这次是基于MySQL 5.7.26做测试

准备数据

没有一千万的数据怎么办？

创建呗

代码创建一千万？那是不可能的，太慢了，可能真的要跑一天。可以采用数据库脚本执行速度快很多。

创建表

创建数据脚本

采用批量插入，效率会快很多，而且每1000条数就commit，数据量太大，也会导致批量插入效率慢

开始测试

哥的电脑配置比较低：win10 标压渣渣i5 读写约500MB的SSD。由于配置低，本次测试只准备了3148000条数据，占用了磁盘5G(还没建索引的情况下)，跑了38min，电脑配置好的同学，可以插入多点数据测试。

返回结果：3148000

三次查询时间分别为：

14060 ms

13755 ms

13447 ms

普通分页查询

MySQL 支持 LIMIT 语句来选取指定的条数数据， Oracle 可以使用 ROWNUM 来选取。

MySQL分页查询语法如下：

第一个参数指定第一个返回记录行的偏移量

第二个参数指定返回记录行的最大数目

下面我们开始测试查询结果：

查询3次时间分别为：

59 ms

49 ms

50 ms

这样看起来速度还行，不过是本地数据库，速度自然快点。

换个角度来测试

相同偏移量，不同数据量

查询时间如下：

从上面结果可以得出结束：数据量越大，花费时间越长

相同数据量，不同偏移量

查询时间如下：

从上面结果可以得出结束：偏移量越大，花费时间越长

如何优化

既然我们经过上面一番的折腾，也得出了结论，针对上面两个问题：偏移大、数据量大，我们分别着手优化

优化偏移量大问题

采用子查询方式

我们可以先定位偏移位置的 id，然后再查询数据

查询结果如下：

从上面结果得出结论：

第一条花费的时间最大，第三条比第一条稍微好点

子查询使用索引速度更快

缺点：只适用于id递增的情况

id非递增的情况可以使用以下写法，但这种缺点是分页查询只能放在子查询里面

注意：某些 mysql 版本不支持在 in 子句中使用 limit，所以采用了多个嵌套select

采用 id 限定方式

这种方法要求更高些，id必须是连续递增，而且还得计算id的范围，然后使用 between，sql如下

查询结果如下：

从结果可以看出这种方式非常快

注意：这里的 LIMIT 是限制了条数，没有采用偏移量

优化数据量大问题

返回结果的数据量也会直接影响速度

查询结果如下：

从结果可以看出减少不需要的列，查询效率也可以得到明显提升

第一条和第三条查询速度差不多，这时候你肯定会吐槽，那我还写那么多字段干啥呢，直接 * 不就完事了

注意本人的 MySQL 服务器和客户端是在_同一台机器_上，所以查询数据相差不多，有条件的同学可以测测客户端与MySQL分开

SELECT * 它不香吗？

在这里顺便补充一下为什么要禁止 SELECT *。难道简单无脑，它不香吗？

主要两点：

1.用 "SELECT * " 数据库需要解析更多的对象、字段、权限、属性等相关内容，在 SQL 语句复杂，硬解析较多的情况下，会对数据库造成沉重的负担。

2.增大网络开销，* 有时会误带上如log、IconMD5之类的无用且大文本字段，数据传输size会几何增涨。特别是MySQL和应用程序不在同一台机器，这种开销非常明显。

一千万数据，怎么快速查询？

开始测试

如何优化

优化偏移量大问题

优化数据量大问题

SELECT * 它不香吗？

一千万数据，怎么快速查询？

王者荣耀:好运60卡剩余的六款皮肤有哪些,带你提前预告一下-实时焦点

世界观热点：劣质酒“秒变”高端酒 警方端掉一贩卖“假酒”窝点

焦点速看：谍战剧《前行者》并不是影视新宠，两宋时期的谍战剧更精彩

武汉今年将再建设10处小微湿地

我40岁了就不能玩逆水寒？大姐哭诉：为什么男的都不愿和我结情缘 环球微资讯

恐怖的冰_恐怖的冰激淋店

泰晤士报：若无缘下赛季欧冠，切尔西面临违反FFP风险

《狂飙》很少人看懂的暗示：一处伏笔很扎心，三个角色逃脱惩罚 环球快资讯

多元支付不是要取代现金

当前热议!打破西装“局限”，重塑西装风尚，西装俊俏佳人—杨童舒

韩媒果然“实在”！李钟硕的图，不P一下就放出来 当前速递

南安拔拔灯 再现海丝古渡大场景 全球速看料

木梳哪种材质好 木梳什么材质的好

孩子可不可以吃海参_小孩能不能吃海参呢相关内容简介介绍

天天关注：成都02月01日13时疫情有多少例 _昨日新增0例本土确诊病例、0例本土无症状感染者

银川燃油汽车政府消费券多少钱？名额有多少？

全球快资讯：我国管辖的海域面积是多少平方米_我国管辖的海域面积

畅销之作《我重生到2002年》，曲折离奇的情节，老书虫们都在讨论|时讯

环球滚动:安阳市男科医院「哪家好」安阳的医院男科排名

每日焦点！北京金融法院召开优化营商环境工作室座谈会 协同化解纠纷为企业纾危解困

走私货物罪可以追究什么刑事责任？

川西新龙有什么景点 （四川新龙旅游哪里好玩）

提进度保障任务兑现 多地重大项目加快推进-天天新资讯

广州：建议非紧急就医优先选择互联网医院等就诊 全球速递

《消失的孩子》未止步于悬疑 改编立足高分原著

翔顺：文旅融合探寻发展新动能 “温泉+N”发展模式多元旅游度假

深圳东部最大交通枢纽雏形已现 总体工程量已经完成七成

深圳建设交通强市行动计划发布 提出这些目标

深圳：盐田北综合车场建设完成 可提供公交车停车位289个

广西加快推进交通运输科技创新与智慧绿色交通发展

启动防洪应急响应 深圳：11日至13日部分列车停运

深圳已进入强降水活跃期 降雨天气易积水点有182处

京交通发展驶上快车道 实现“一票通行”“一站安检”

为高考护航！南宁警方严查交通噪声扰民

当前关注：南宁大桥这一路口交通信号灯优化 市民：好走多了！

好消息！银保监会、央行规范银行信用卡业务经营乱象

政策红利效果将进一步显现 上半年快递业务收入接近5000亿元

东莞地铁2号线三期工程计划今年9月开工 全长共计17.3公里

广西市场监管系统放心消费创建现场会在桂林召开

月内降准概率增加！2月信贷数据释放什么信号

月内降准概率增加！2月信贷数据释放什么信号

40家房企融资数据出炉：2月份融资金额创近2年新低

40家房企融资数据出炉：2月份融资金额创近2年新低

花8000多元买的商品，白等两个月却没收到货？

花8000多元买的商品，白等两个月却没收到货？

花8000多元买的商品，白等两个月却没收到货？

广东省消委会发布二手车买卖合同示范文本

广东省消委会发布二手车买卖合同示范文本

广东省消委会发布二手车买卖合同示范文本

73.62亿元！根治欠薪冬季专项行动收官

73.62亿元！根治欠薪冬季专项行动收官

73.62亿元！根治欠薪冬季专项行动收官

对标新修改的工会法 完善地方性劳动法规定

对标新修改的工会法 完善地方性劳动法规定

对标新修改的工会法 完善地方性劳动法规定

沈阳市总计划每年打造一批品牌工作和特色经验

沈阳市总计划每年打造一批品牌工作和特色经验

沈阳市总计划每年打造一批品牌工作和特色经验

2月份西安新房价格领涨，北上广领跑二手房

全国首个跨境进口商品质量安全公共服务平台出炉

全国首个跨境进口商品质量安全公共服务平台出炉

全国首个跨境进口商品质量安全公共服务平台出炉

遭资本热炒的医美赛道如今暴跌 最严监管已到来

遭资本热炒的医美赛道如今暴跌 最严监管已到来

遭资本热炒的医美赛道如今暴跌 最严监管已到来

秦皇岛市总探索新就业形态劳动者建会入会新路径

国家卫健委：家庭医生签约服务“最后一公里”有望打通

国家卫健委：家庭医生签约服务“最后一公里”有望打通

国家卫健委：家庭医生签约服务“最后一公里”有望打通

把算法开关交给消费者 以保障消费者权益

把算法开关交给消费者 以保障消费者权益

把算法开关交给消费者 以保障消费者权益

截至2021年底 全国乘用车产能利用率仅为52.47%

世界观热点：劣质酒“秒变”高端酒警方端掉一贩卖“假酒”窝点

我40岁了就不能玩逆水寒？大姐哭诉：为什么男的都不愿和我结情缘环球微资讯

《狂飙》很少人看懂的暗示：一处伏笔很扎心，三个角色逃脱惩罚环球快资讯

韩媒果然“实在”！李钟硕的图，不P一下就放出来当前速递

南安拔拔灯再现海丝古渡大场景全球速看料

木梳哪种材质好木梳什么材质的好

每日焦点！北京金融法院召开优化营商环境工作室座谈会协同化解纠纷为企业纾危解困

川西新龙有什么景点（四川新龙旅游哪里好玩）

提进度保障任务兑现多地重大项目加快推进-天天新资讯

广州：建议非紧急就医优先选择互联网医院等就诊全球速递

《消失的孩子》未止步于悬疑改编立足高分原著

深圳东部最大交通枢纽雏形已现总体工程量已经完成七成

深圳建设交通强市行动计划发布提出这些目标

深圳：盐田北综合车场建设完成可提供公交车停车位289个

启动防洪应急响应深圳：11日至13日部分列车停运

深圳已进入强降水活跃期降雨天气易积水点有182处

京交通发展驶上快车道实现“一票通行”“一站安检”

当前关注：南宁大桥这一路口交通信号灯优化市民：好走多了！

政策红利效果将进一步显现上半年快递业务收入接近5000亿元

东莞地铁2号线三期工程计划今年9月开工全长共计17.3公里

对标新修改的工会法完善地方性劳动法规定

对标新修改的工会法完善地方性劳动法规定

对标新修改的工会法完善地方性劳动法规定

遭资本热炒的医美赛道如今暴跌最严监管已到来

遭资本热炒的医美赛道如今暴跌最严监管已到来

遭资本热炒的医美赛道如今暴跌最严监管已到来

把算法开关交给消费者以保障消费者权益

把算法开关交给消费者以保障消费者权益

把算法开关交给消费者以保障消费者权益

截至2021年底全国乘用车产能利用率仅为52.47%

截至2021年底全国乘用车产能利用率仅为52.47%

截至2021年底全国乘用车产能利用率仅为52.47%

职工因疫情隔离在家被裁员法院这样判

夫妻二人用工业硫磺熏制竹笋查获20余吨

质量问题、虚假宣传等老问题占比较大车主权益如何保障？

2025年住房和城乡建设领域科技创新能力大幅提升

七旬养猪老汉系外省命案逃犯持刀杀人潜逃13年后宿迁落网

广西百色疫情社区传播链基本阻断社会面基本实现清零

上班时间向招聘网站投简历被裁媒体：职场数字化管理别

广西百色：社会面基本清零健康码转码工作有序开展

广西贺州“碰瓷女王”重操旧业再度入狱

外卖小哥热汤圆吃出幸福感生活不易愿被社会温柔以待

宁波天一阁邀民众共乐“闹”元宵猜灯谜等传统民俗受热捧

预制菜“大热”元宵餐桌中国 “Z世代”成掌勺主力

山东泰安：提升执法司法质效让执法监督长出“牙齿”

农机助力种地省心

扎根中国大地办出中国特色争创世界一流

守护海陀之巅走近国内第一支专业高山救援队

各国动植物“精灵”庆冬奥你能猜到她是谁吗？

从货担郎到日售数千斤兰州手艺人40余载“滚”元宵留年

河南晒出2021年交通“成绩单”：村村通、户户通农村公

河南226家A级景区2月16日起免门票含少林寺、龙门石窟等

身边小商铺连着千万家

一男子地铁站晕倒休克路过女护士出手相救

河南中小学将迎开学季多地要求返校师生须核酸检测

安徽新增1例无症状感染者系境外输入

江苏南通发现1人检测结果呈阳性系外地返通人员