详解Mariadb聚合函数及分组查询

MariaDB Server 是最流行的开源关系型数据库之一。它由 MySQL 的原始开发者制作,并保证保持开源。它是大多数云产品的一部分,也是大多数Linux发行版的默认配置。MariaDB 被设计为 MySQL 的直接替代产品,具有更多功能,新的存储引擎,更少的错误和更好的性能。

聚合函数

当我们需要汇总表中的数据而不是使用表中某一行数据时,可以使用Mysql为我们提供的聚合函数,在Mysql中,常用的聚合函数有以下五个:

  1. AVG:取平均值
  2. COUNT:取统计值
  3. MAX:取最大值
  4. MIN:取最小值
  5. SUM:取和值

1.获得表中人口的总和

MariaDB [world]> SELECT SUM(Population) FROM city;
+-----------------+
| SUM(Population) |
+-----------------+
|      1429559884 |
+-----------------+
1 row in set (0.01 sec)

2.获得数据表中中国的总人口

MariaDB [world]> SELECT SUM(Population) FROM city WHERE CountryCOde='CHN';
+-----------------+
| SUM(Population) |
+-----------------+
|       175953614 |
+-----------------+
1 row in set (0.00 sec)

3.查询中国有多少个城市

MariaDB [world]> SELECT COUNT(ID) FROM city WHERE CountryCode =  'CHN';
+-----------+
| COUNT(id) |
+-----------+
|       363 |
+-----------+
1 row in set (0.00 sec)

关于COUNT,如果要统计有该表有多少行,千万别用*作为参数,因为~影响性能,选某一列就好了。

4.查询中国人口最少的城市的人口是多少

MariaDB [world]> SELECT MIN(Population) FROM city WHERE CountryCode = 'CHN';
+-----------------+
| MIN(Population) |
+-----------------+
|           89288 |
+-----------------+
1 row in set (0.00 sec)

5.查询中国人口最多的城市的人口

MariaDB [world]> SELECT MAX(Population) FROM city WHERE CountryCode = 'CHN';
+-----------------+
| MAX(Population) |
+-----------------+
|         9696300 |
+-----------------+
1 row in set (0.00 sec)

6.查询河南各城市的平均人口

MariaDB [world]> SELECT AVG(Population) FROM city WHERE District ='Henan';
+-----------------+
| AVG(Population) |
+-----------------+
|     383278.3333 |
+-----------------+
1 row in set (0.00 sec)

所以,我们看到,聚合函数通常用于数值上的计算。

分组查询

以上,我们使用聚合函数时,是对所有SELECT的数据进行分组操作,假如我们想要查询所有国家的城市数,不得不多次使用WHERE对CountryCode进行筛选。

MariaDB [world]> SELECT DISTINCT CountryCode FROM city;
+-------------+
| CountryCode |
+-------------+
| ABW         |
| AFG         |
...............
| ZWE         |
+-------------+
232 rows in set (0.00 sec)

我们看到,在我们的数据表中,有232个国家,那么?是不是需要我们对这232个不同国家都使用一次COUNT(ID)才能统计每个国家的城市数量呢?其实不然。

我们可以使用分组查询GROUP BY,什么叫分组呢? 分组查询就是使用指定的一列或多列,对数据进行逻辑分组(当分组依据相同时被划分为一组),假设有如下数据:

MariaDB [world]> SELECT * FROM city LIMIT 5;
+----+----------------+-------------+---------------+------------+
| ID | Name           | CountryCode | District      | Population |
+----+----------------+-------------+---------------+------------+
|  1 | Kabul          | AFG         | Kabol         |    1780000 |
|  2 | Qandahar       | AFG         | Qandahar      |     237500 |
|  3 | Herat          | AFG         | Herat         |     186800 |
|  4 | Mazar-e-Sharif | AFG         | Balkh         |     127800 |
|  5 | Amsterdam      | NLD         | Noord-Holland |     731200 |
+----+----------------+-------------+---------------+------------+
5 rows in set (0.00 sec)

我们使用GROUP BY CountryCode就是指定CountryCode作为分组依据,所以1,2,3,4行他们被分为同一组,而5在另一个组。

  1. 通常分组是配合聚合函数来使用的,聚合函数对每个单独的逻辑分组进行汇总计算。
  2. GROUP BY子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚合函数),如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式,且不能使用别名。
  3. 除聚合函数外,SELECT语句中的每一列都必须在GROUP BY子句中给出。
  4. 如果分组中包含具有NULL值的行,则NULL将作为一个分组返回。
  5. GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前。

1.查询各个国家的城市数量

MariaDB [world]> SELECT CountryCode,COUNT(ID) FROM city GROUP BY CountryCode;
+-------------+-----------+
| CountryCode | COUNT(ID) |
+-------------+-----------+
| ABW         |         1 |
| AFG         |         4 |
...........................
| ZMB         |         7 |
| ZWE         |         6 |
+-------------+-----------+
232 rows in set (0.00 sec)

当SELECT语句中使用WHERE子句时,WHERE子句总在分组前进行过滤。

2.查询各个国家人口大于1000000的城市数量

MariaDB [world]> SELECT CountryCode,COUNT(ID) FROM city WHERE Population >= 1000000 GROUPP BY CountryCode;
+-------------+-----------+
| CountryCode | COUNT(ID) |
+-------------+-----------+
| AFG         |         1 |
| AGO         |         1 |
| ARG         |         3 |
| ARM         |         1 |
| AUS         |         4 |
...........................
| YUG         |         1 |
| ZAF         |         1 |
| ZMB         |         1 |
| ZWE         |         1 |
+-------------+-----------+
77 rows in set (0.01 sec)

所以在分组中未出现的国家,没有1000000人口的城市。

3.查询总人口大于1000000的国家有哪些

HAVING子句用于过滤分组后所得到汇总值的数据,而HAVING支持的操作和WHERE子句是相同的。

例如:

MariaDB [world]> SELECT CountryCode,SUM(Population) AS Total_Population FROM city GROUP BY CountryCode HAVING Total_Population > 1000000;
+-------------+------------------+
| CountryCode | Total_Population |
+-------------+------------------+
| AFG         |          2332100 |
| AGO         |          2561600 |
| ARE         |          1728336 |
..................................
| ZAF         |         15196370 |
| ZMB         |          2473500 |
| ZWE         |          2730420 |
+-------------+------------------+
108 rows in set (0.00 sec)

原创文章,作者:晴川运维,如若转载,请注明出处:https://baike.qcidc.com/6618.html

(0)
晴川运维晴川运维
上一篇 2025年6月8日
下一篇 2025年6月8日

相关推荐

  • 通过GIt备份Linux文件

    我们使用 Linux 服务器时,有时候需要备份配置文件。传统的备份方法是复制文件,改名,并在文件结尾插入一些字符。但,如果我们使用 Git ,我们可以很轻松的管理配置文件的备份。 …

    Linux系统 2025年10月11日
  • 详解rsync的使用方法

    rsync 是一个常用的 Linux 应用程序,用于文件同步,它可以在本地计算机与远程计算机之间,或者两个本地目录之间同步文件(但不支持两台远程计算机之间的同步)。它也可以当作文件…

    Linux系统 2025年9月19日
  • Linux系统下安装并使用Gmail

    Gmail是 Google的免费网络邮件服务。它随付内置的搜索技术并提供15G以上的存储空间。可以永久保留重要的邮件、文件和图片,使用搜索快速、轻松地查找任何需要的内容,让这种作为…

    Linux系统 2025年10月8日
  • 快速上手Vue.js

    Vue.js是当下很火的一个JavaScript MVVM库,它是以数据驱动和组件化的思想构建的。相比于Angular.js,Vue.js提供了更加简洁、更易于理解的API,使得我…

    Linux系统 2025年7月9日
  • Shell脚本习题:指定日期减去一天

    如果只减去一天的话,直接写就可以了。 #date -d”yesterday 20150401″ +%Y%m%d 如果要减去几天,还可以这样写,如果用负…

    Linux系统 2025年10月22日
  • Linux umount命令:卸载文件系统

    前面介绍了如何将光盘和 U 盘挂载在系统中,而在使用完成后,需要先将其与挂载点取消关联,然后才能成功卸载。不过,硬盘分区是否需要卸载,取决于你下次是否还需要使用,一般不对硬盘分区执…

    Linux系统 2025年7月7日
  • Eclipse中修改字符集具体方法

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准…

    Linux系统 2025年6月15日
  • 使用unzip命令解压缩文件

    unzip解压命令的使用方法:【unzip test.zip】,表示将压缩文件test.zip解压到当前目录下。unzip命令用于解压缩由zip命令压缩的【.zip】压缩包。 安装…

    Linux系统 2025年10月27日
  • 快速上手Linux OpenSSL命令

    OpenSSL是一个强大的安全套接字层密码库,Apache使用它加密HTTPS,OpenSSH使用它加密SSH,但是,你不应该只将其作为一个库来使用,它还是一个多用途的、跨平台的密…

    Linux系统 2025年9月17日
  • CentOS中使用RPM包安装redis具体方法

    Redis 是一个高性能的key-value数据库。 redis的出现,很大程度补偿了memcached这类keyvalue存储的不足,在部 分场合可以对关系数据库起到很好的补充作…

    Linux系统 2025年6月8日

发表回复

登录后才能评论