MySQL 使用 JPA + Hibernate 的 9 个高性能技巧介绍尽管有SQL标准

介绍

尽管有SQL标准，但每个关系数据库终将是唯一的，因此你需要调整数据访问层，以便充分利用在使用中的关系数据库。

在本文中，我们将介绍在使用带有JPA和Hibernate的MySQL时，为了提高性能，我们可以做哪些事情。

不要使用AUTO标识符GeneratorType

每个实体都需要标识符，标识符惟一地标识与该实体关联的表记录。JPA和Hibernate允许根据三种不同的策略自动生成实体标识符：

IDENTITY

SEQUENCE

TABLE

正如我在这篇文章中所解释的，当增加数据库连接数时，TABLE标识符策略不会缩放。而且，即使是一个数据库连接，标识符生成响应时间比使用IDENTITY或SEQUENCE大十倍。

如果你使用AUTO GenerationType：

@Id@GeneratedValue(strategy = GenerationType.AUTO)private Long id;

Hibernate 5将会退回到使用TABLE生成器，这对性能不利。

正如我在这篇文章中所解释的，你可以使用以下映射轻松解决此问题：

@Id@GeneratedValue(strategy= GenerationType.AUTO, generator="native")@GenericGenerator(name = "native", strategy = "native")private Long id;

本地生成器将选择IDENTITY而不是TABLE。

IDENTITY生成器禁用JDBC批处理插入

MySQL 5.7和8.0都不支持SEQUENCE对象，因此你需要使用IDENTITY。但是，正如我在这篇文章中所解释的，IDENTITY生成器可以防止Hibernate使用JDBC批量插入。

JDBC批量更新和删除不受影响，只有INSERT语句不能被批处理，因为在Persistence Context被刷新之前，INSERT语句已被执行，从而Hibernate知道要分配给持久化实体什么实体标识符。

如果要解决此问题，则必须通过不同的框架，如jOOQ，执行JDBC批处理插入。

通过Docker和tmpfs加速集成测试

MySQL和MariaDB在不得不丢弃数据库模式的时候，以及每次新的集成测试即将运行因而重新创建它的时候，是非常慢的。但是，你可以在Docker和tmpfs的帮助下轻松解决此问题。

正如我在这篇文章中所解释的，通过映射内存中的数据文件夹，集成测试的运行速度将与有内存数据库（如H2或HSQLDB）时的速度相同。

对非结构化数据使用JSON

即使是在你使用RDBMS的时候，肯定也有很多次想要存储非结构化数据：

来自客户端，如JSON的数据，需要被解析并插入到我们的系统中。

可以缓存的图像处理结果以保存再处理

虽然本机不支持，但是你可以轻松地将Java对象映射到JSON列。甚至可以将JSON列类型映射到Jackson JsonNode。

更重要的是，你甚至不必编写这些自定义类型，可以从Maven Central中抓取：

<dependency> <groupId>com.vladmihalcea</groupId> <artifactId>hibernate-types-52</artifactId> <version>1.0.0</version></dependency>

很酷，对吧？

使用存储过程来保存数据库

在处理大量数据时，将所有数据移入和移出数据库并不是非常高效。不过，通过调用存储过程对数据库端进行处理会好很多。

有关更多详细信息，请参阅这篇有关如何调用带有JPA和Hibernate的MySQL存储过程的文章。

小心ResultSet流

SQL流在两层应用程序中是很有意义的。如果你要执行ResultSet流，那么你也得注意JDBC驱动程序。在MySQL上，你需要将Statement大小设置为Integer.MIN_VALUE。

然而，对于基于Web的应用程序，分页更为合适。JPA 2.2甚至引入了对Java 1.8 Stream方法的支持，但执行计划可能不如使用SQL级别分页时那么高效。

PreparedStatements可能会被仿真

你可能以为，既然Hibernate默认使用PreparedStatements，那么所有语句都是像这样执行的：

实际上，更像是这样执行的：

正如我在这篇文章中所解释的，除非你设置了useServerPrepStmts MySQL JDBC驱动程序属性，否则PreparedStatements将在JDBC驱动程序级别进行仿真以保存一个额外的数据库。

始终结束数据库事务

在关系数据库中，每个语句都在给定的数据库事务中执行。因此，事务是不可选的。

但是，你应该始终通过提交或回滚来结束当前正在运行的事务。忘记结束事务可能会导致持续被锁很长时间，同时也会阻止MVCC清理过程回收不再需要的旧元组或索引条目。

递交日期/时间没有那么容易

编程中有两件非常复杂的事情：

处理编码

处理跨多个时区的日期/时间

为了解决第二个问题，最好在UTC时区中保存所有时间戳。但是，当使用MySQL时，你还需要将useLegacyDatetimeCode JDBC Driver配置属性设置为false。

结论

正如你所看到的，在使用带有JPA和Hibernate的MySQL时，要记住许多事情。因为MySQL是最为广泛部署的RDBMS之一，并被绝大多数的Web应用程序所使用，所以，了解所有这些技巧并调整数据访问层来最大限度地利用它非常有用。