网站建设 >

查看其它板块

如何编写更好的SQL查询：终极指南-第二部分-创新互联

如何编写更好的SQL查询：终极指南-第二部分

创新互联成立十年来，这条路我们正越走越好，积累了技术与客户资源，形成了良好的口碑。为客户提供成都网站设计、网站制作、网站策划、网页设计、域名注册、网络营销、VI设计、网站改版、漏洞修补等服务。网站是否美观、功能强大、用户体验好、性价比高、打开快等等，这些对于网站建设都非常重要，创新互联通过对建站技术性的掌握、对创意设计的研究为客户提供一站式互联网解决方案，携手广大客户，共同发展进步。

上一篇文章中，我们学习了 SQL 查询是如何执行的以及在编写 SQL 查询语句时需要注意的地方。

下面，我进一步学习查询方法以及查询优化。

基于集合和程序的方法进行查询

反向模型中隐含的事实是，建立查询时基于集合和程序的方法之间存在着不同。

查询的程序方法是一种非常类似于编程的方法：你告诉系统需要做些什么以及如何做。例如上一篇文章中的示例，通过执行一个函数然后调用另一个函数来查询数据库，或者使用包含循环、条件和用户定义函数（UDF）的逻辑方式来获得最终查询结果。你会发现通过这种方式，一直在请求一层一层中数据的子集。这种方法也经常被称为逐步或逐行查询。
另一种是基于集合的方法，只需指定需要执行的操作。使用这种方法要做的事情就是，指定你想通过查询获得的结果的条件和要求。在检索数据过程中，你不需要关注实现查询的内部机制：数据库引擎会决定最佳的执行查询的算法和逻辑。

由于 SQL 是基于集合的，所以这种方法比起程序方法更加有效，这也解释了为什么在某些情况下，SQL 可以比代码工作地更快。

基于集合的查询方法也是数据挖掘分析行业要求你必须掌握的技能！因为你需要熟练的在这两种方法之间进行切换。如果你发现自己的查询中存在程序查询，则应该考虑是否需要重写这部分。

从查询到执行计划

反向模式不是静止不变的。在你成为 SQL 开发者的过程中，避免查询反向模型和重写查询可能会是一个很艰难的任务。所以时常需要使用工具以一种更加结构化的方法来优化你的查询。

对性能的思考不仅需要更结构化的方法，还需要更深入的方法。

然而，这种结构化和深入的方法主要是基于查询计划的。查询计划首先被解析为“解析树”并且准确定义了每个操作使用什么算法以及如何协调操作过程。

查询优化

在优化查询时，很可能需要手动检查优化器生成的计划。在这种情况下，将需要通过查看查询计划来再次分析你的查询。

要掌握这样的查询计划，你需要使用一些数据库管理系统提供给你的工具。你可以使用以下的一些工具：

一些软件包功能工具可以生成查询计划的图形表示。
其它工具能够为你提供查询计划的文本描述。

请注意，如果你正在使用 PostgreSQL，则可以区分不同的 EXPLAIN，你只需获取描述，说明 planner 如何在不运行计划的情况下执行查询。同时 EXPLAIN ANALYZE 会执行查询，并返回给你一个评估查询计划与实际查询计划的分析报告。一般来说，实际执行计划会切实的执行这个计划，而评估执行计划可以在不执行查询的情况下，解决这个问题。在逻辑上，实际执行计划更为有用，因为它包含了执行查询时，实际发生的其它细节和统计信息。

接下来你将了解 XPLAIN 和 ANALYZE 的更多信息，以及如何使用这两个命令来进一步了解你的查询计划和查询性能。要做到这一点，你需要开始使用两个表： one_million 和 half_million 来做一些示例。

你可以借助 EXPLAIN 来检索 one_million 表的当前信息：确保已将其放在运行查询的首要位置，在运行完成之后，会返回到查询计划中：

EXPLAINSELECT *
FROM one_million;
QUERY PLAN_________________________________________________
Seq Scan on one_million
(cost=0.00..18584.82 rows=1025082 width=36)
(1 row)

在以上示例中，我们看到查询的 Cost 是0.00..18584.82 ，行数是1025082，列宽是36。

同时，也可以借助 ANALYZE 来更新统计信息。

ANALYZE one_million;
EXPLAINSELECT *
FROM one_million;
QUERY PLAN_________________________________________________
Seq Scan on one_million
(cost=0.00..18334.00 rows=1000000 width=37)
(1 row)

除了 EXPLAIN 和 ANALYZE，你也可以借助 EXPLAIN ANALYZE 来检索实际执行时间：

EXPLAIN ANALYZESELECT *
FROM one_million;
QUERY PLAN___________________________________________________
Seq Scan on one_million
(cost=0.00..18334.00 rows=1000000 width=37)
(actual time=0.015..1207.019 rows=1000000 loops=1)
Total runtime: 2320.146 ms
(2 rows)

使用 EXPLAIN ANALYZE 的缺点就是需要实际执行查询，这点值得注意！

到目前为止，我们看到的所有算法是顺序扫描或全表扫描：这是一种在数据库上进行扫描的方法，扫描的表的每一行都是以顺序（串行）的顺序进行读取，每一列都会检查是否符合条件。在性能方面，顺序扫描不是最佳的执行计划，因为需要扫描整个表。但是如果使用慢磁盘，顺序读取也会很快。

还有一些其它算法的示例：

EXPLAIN ANALYZESELECT *
FROM one_million JOIN half_millionON
(one_million.counter=half_million.counter);
QUERY PLAN
_____________________________________________________________
Hash Join (cost=15417.00..68831.00 rows=500000 width=42)
(actual time=1241.471..5912.553 rows=500000 loops=1)
Hash Cond: (one_million.counter = half_million.counter)
   -> Seq Scan on one_million
   (cost=0.00..18334.00 rows=1000000 width=37)
   (actual time=0.007..1254.027 rows=1000000 loops=1)
     -> Hash (cost=7213.00..7213.00 rows=500000 width=5)
   (actual time=1241.251..1241.251 rows=500000 loops=1)
   Buckets: 4096 Batches: 16 Memory Usage: 770kB
     -> Seq Scan on half_million
   (cost=0.00..7213.00 rows=500000 width=5)
(actual time=0.008..601.128 rows=500000 loops=1)
Total runtime: 6468.337 ms

我们可以看到查询优化器选择了 Hash Join。请记住这个操作，因为我们需要使用这个来评估查询的时间复杂度。我们注意到了上面示例中没有 half_million.counter 索引，我们可以在下面示例中添加索引：

CREATE INDEX ON half_million(counter);
EXPLAIN ANALYZESELECT *
FROM one_million JOIN half_millionON
(one_million.counter=half_million.counter);
QUERY PLAN
______________________________________________________________
Merge Join (cost=4.12..37650.65 rows=500000 width=42)
(actual time=0.033..3272.940 rows=500000 loops=1)
Merge Cond: (one_million.counter = half_million.counter)
   -> Index Scan using one_million_counter_idx on one_million
   (cost=0.00..32129.34 rows=1000000 width=37)
   (actual time=0.011..694.466 rows=500001 loops=1)
     -> Index Scan using half_million_counter_idx on half_million
   (cost=0.00..14120.29 rows=500000 width=5)
(actual time=0.010..683.674 rows=500000 loops=1)
Total runtime: 3833.310 ms
(5 rows)

通过创建索引，查询优化器已经决定了索引扫描时，如何查找 Merge join。

请注意，索引扫描和全表扫描（顺序扫描）之间的区别：后者（也称为“表扫描”）是通过扫描所有数据或索引所有页面来查找到适合的结果，而前者只扫描表中的每一行。

教程的第二部分内容，就介绍到这里。后续还会有《如何编写更好的SQL查询》系列的最后一篇文章，敬请期待。

原文链接：http://www.kdnuggets.com/2017/08/write-better-sql-queries-definitive-guide-part-2.html

转载请注明出自：葡萄城控件

另外有需要云服务器可以了解下创新互联cdcxhl.cn，海内外云服务器15元起步，三天无理由+7*72小时售后在线，公司持有idc许可证，提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案，具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势，专为企业上云打造定制，能够满足用户丰富、多元化的应用场景需求。

本文名称：如何编写更好的SQL查询：终极指南-第二部分-创新互联
地址分享：http://cdkjz.cn/article/dpdhsj.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

微信小程序四川服务器托管特丽尔硅藻泥达州主机托管网络营销推广鸿程源茂橡塑板网络营销推广电商网站建设成都微信小程序开发

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

如何编写更好的SQL查询：终极指南-第二部分-创新互联

基于集合和程序的方法进行查询

从查询到执行计划

查询优化

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

如何编写更好的SQL查询：终极指南-第二部分-创新互联

基于集合和程序的方法进行查询

从查询到执行计划

查询优化

相关资讯

php敏感数据加密 php数据加密解密

排序大小函数c语言 c中排序函数

发票安全接入服务器连不上 开票软件安全接入服务器地址连接失败

英国留学智能聊天 英国留学插头转换器带几个

vb点虐 画刷 vb实现简易绘画

linux命令调用接口 linux 调用接口

php如何查询读取数据 php如何查询读取数据的次数

php显示数据库查询时间 php查询数据库并显示

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

发票安全接入服务器连不上开票软件安全接入服务器地址连接失败

英国留学智能聊天英国留学插头转换器带几个

vb点虐画刷 vb实现简易绘画

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接