1. 描述
在MySQL中,當我們需要獲取某張表中的總行數時,一般會選擇使用下面的語句
select count(*) from table;
其實count函數中除了*還可以放其他參數,比如常數、主鍵id、字段,那么它們有什么區別?各自效率如何?我們應該使用哪種方式來獲取表的行數呢?
當搞清楚count函數的運行原理后,相信上面幾個問題的答案就會了然于胸。
2. 表結構
為了解決上述的問題,我創建了一張 user 表,它有兩個字段:主鍵id和name,后者可以為null,建表語句如下。
CREATE TABLE `user` (
`id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主鍵',
`name` varchar(255) DEFAULT NULL COMMENT '姓名',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
在該表中共有6000000條數據,前1000000條數據行的name字段為空,其余數據行name=id,使用存儲過程造測試數據的代碼如下
-- 使用存儲過程造測試數據
delimiter;;
create procedure idata()
begin
declare i int;
set i=1;
while(i=6000000)do
insert into user values(i, i);
set i=i+1;
end while;
end;;
delimiter;
call idata();
-- 將前1000000條數據的name字段置為null
update user set name=null where id1000000;
3. 執行 SQL 語句及結果
為了區分count函數不同參數的區別,主要從執行時間和掃描行數這兩方面來描述SQL的執行效率,同時還會從返回結果來描述`count函數的特性。
- *符號 ——
select count(*) from user
;
- 常數——
select count(1) from user
;
- 非空字段——
select count(id) from user
;
- 可為空的字段——
select count(name) from user
;
3.1 *符號
mysql> select count(*) from user;
+----------+
| count(*) |
+----------+
| 6000000 |
+----------+
1 row in set (0.76 sec)
遍歷全表,不取值(優化后,必定不是null,不取值),累加計數,最終返回結果。
3.2 常數
mysql> select count(1) from user;
+----------+
| count(1) |
+----------+
| 6000000 |
+----------+
1 row in set (0.76 sec)
遍歷全表,一行行取數據,將每一行賦值為1,判斷到該字段不可為空,累加計數,最終返回結果。
3.3 非空字段
mysql> select count(id) from user;
+-----------+
| count(id) |
+-----------+
| 6000000 |
+-----------+
1 row in set (0.85 sec)
遍歷全表,一行行取數據(會選擇最小的索引樹來遍歷,所以比相同情況下的count字段效率更高),取每行的主鍵id,判斷到該字段不可為空,累加計數,最終返回結果。
3.4 可為空的字段
mysql> select count(name) from user;
+-------------+
| count(name) |
+-------------+
| 5900001 |
+-------------+
1 row in set (0.93 sec)
- 若字段定義不為空:遍歷全表,一行行取數據,取每行的該字段,判斷到該字段不可為空,累加計數,最終返回結果。
- 若字段定義可為空:遍歷全表,一行行取數據,取每行的該字段,判斷到該字段可能是null,然后再判斷該字段的值是否為null,不為null才累加計數,最終返回結果。
- 若該字段沒有索引,將遍歷主鍵索引樹。
4. 執行結果分析
4.1 結果集
首先從結果集的角度來看,前三條 SQL 語句的目的是一樣的——返回的是所有行數,而 count
函數的參數是普通字段且字段默認為 null
的時候,它返回的是該字段不為 null
的行數。
4.2 執行時間
從執行時間上來看的話,效率大致是count(可為空的字段) count(非空字段) count(常數) count(*)
。
5. 總結
count是一個聚合函數,對于返回的結果集,一行行地判斷,如果count函數的參數不是NULL,累計值就加1,否則不加。最后返回累計值。
count(*)
速度最快的原因是它不會在計數的時候去取每行數據值
count(1)
比count(*)
稍慢的原因是它會取每個數據行并賦值為1
count(非空字段)
比count(1)
稍慢的原因是它會從每個數據行中取出主鍵 id
count(可為空的字段)
最慢的原因是它可能需要判斷每個數據行中的改字段是否為 null
所以,最好還是用count(*)。
以上就是詳解 MySQL中count函數的正確使用方法的詳細內容,更多關于MySQL count函數的資料請關注腳本之家其它相關文章!
您可能感興趣的文章:- MySQL 大表的count()優化實現
- MySQL中聚合函數count的使用和性能優化技巧
- 關于mysql中innodb的count優化問題分享
- 聊聊MySQL的COUNT(*)的性能
- 淺談MySQL 統計行數的 count
- mysql count提高方法總結
- MySQL中無過濾條件的count詳解
- MySQL中count(*)、count(1)和count(col)的區別匯總
- mySQL count多個表的數據實例詳解
- MySQL COUNT函數的使用與優化