10.1 聚集函数
聚集函数是运行在行组上,计算和返回单个值的函数。
SQL聚集函数
函数 | 说明 |
AVG() | 返回某列的平均值 |
COUNT() | 返回某列的行数 |
MAX() | 返回某列的最大值 |
MIN() | 返回某列的最小值 |
SUM() | 返回某列值之和 |
10.1.1 AVG()函数:
- AVG()通过对表中行数计数并计算特定列值之和,求得该列的平均值。AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。
SELECT AVG(prod_price) AS avg_price FROM products;- 此SELECT语句返回值avg_Price,它包含products表中所有产品的平均价格。
SELECT AVG(prod_price) AS avg_price FROM products WHERE vend_id = 1003;这条SELECT语句与前一条的不同之处在于它包含了WHERE子句。此WHERE子句仅过滤出vend_id为1003的产品,因此avg_price中返回的值只是该供应商的产品的平均值。
AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。
AVG()函数忽略列值为NULL的行。
10.1.2 COUNT()函数:
COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。
COUNT()函数有两种使用方式:
使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。
使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。
SELECT COUNT(*) AS num_cust FROM customers;在此例子中,利用COUNT(*)对所有行计数,不管行中各列有什么值。计数值在num_cust中返回。
SELECT COUNT(cust_email) AS num_cust FROM customers;这条SELECT语句使用COUNT(cust_email)对cust_email列中有值的行进行计数。在此例子中,cust_email的计数为3(表示5个客户中只有3个客户有电子邮件地址)。
如果指定列名,则指定列的值为空的行被COUNT()函数忽略,但如果COUNT()函数中用的是星号(*),则不忽略。
10.1.3 MAX()函数:
MAX()返回指定列中的最大值,MAX()要求指定列名。
SELECT MAX(prod_price) AS max_price FROM products;这里,MAX()返回products表中最贵的物品的价格。
虽然MAX()一般用来找出最大的数值或日期值,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。
MAX()函数忽略列值为NULL的行。
10.1.4 MIN()函数:
MIN()的功能正好与MAX()功能相反,它返回指定列的最小值,与MAX()一样,MIN()要求指定列名。
SELECT MIN(prod_price) AS min_price FROM products;其中MIN()返回products表中最便宜物品的价格。
MIN()函数与MAX()函数类似,MySQL允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。在用于文本数据时,如果数据按相应的列排序,则MIN()返回最前面的行。
MIN()函数忽略列值为NULL的行。
10.1.5 SUM()函数:
SUM()用来返回指定列值的和(总计)。
SELECT SUM(quantity) AS items_ordered FROM orderitems WHERE order_num = 20005;上述语句,函数SUM(quantity)返回订单中所有物品数量之和,WHERE子句保证只统计某个物品订单中的物品。
SELECT SUM(item_price * quantity) AS total_price FROM orderitems WHERE order_num = 20005;上述语句,函数SUM(item_price*quantity)返回订单中所有物品价钱之和,WHERE子句同样保证只统计某个物品订单中的物品。
如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。
SUM()函数忽略列值为NULL的行。
10.2 聚集不同值
以上5个聚集函数都可以如下使用:
对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为);
只包含不同的值,指定DISTINCT参数。
ALL参数不需要指定,因为它是默认行为。如果不指定DISTINCT,则假定为ALL。
SELECT AVG(DISTINCT prod_price) AS avg_price FROM products WHERE vend_id = 1003;使用AVG()函数返回特定供应商提供的产品的平均价格。它与上面的SELECT语句相同,但使用了DISTINCT参数,因此平均值只考虑各个不同的价格
如果指定列名,则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*),因此不允许使用COUNT(DISTINCT),否则会产生错误。类似地,DISTINCT必须使用列名,不能用于计算或表达式。
虽然DISTINCT从技术上可用于MIN()和MAX(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否包含不同值都是相同的。
10.3 组合聚集函数
SELECT COUNT(*) AS num_items, MIN(prod_price) AS price_min, MAX(prod_price) AS price_max, AVG(prod_price) AS price_avg FROM products;这里用单条SELECT语句执行了4个聚集计算,返回4个值(products表中物品的数目,产品价格的最高、最低以及平均值)。
在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做并非不合法,但使用唯一的名字会使你的SQL更易于理解和使用(以及将来容易排除故障)。