最佳做法是在添加到@ManyToMany的所有者端集合时避免选择所有行
当添加到表示@ManyToMany关联的所属方的集合时,我的JPA实现(Hibernate)将首先选择关联中的所有行,以确定该实体是否已经存在于集合中。
我了解这背后的机制,但在处理大型连接表时,这不是很好的性能。当我知道需要插入条目时,避免加载连接表的所有元素的最佳做法是什么?
我将以一个典型的用户/角色场景为例,为简洁起见,省略了getters/setters/初始化式:
@Entity
public class User {
@Id
private Long id;
@ManyToMany
private Set<Role> roles;
}
@Entity
public class Role {
@Id
private Long id;
private String name;
@ManyToMany(mappedBy = "roles")
private Set<User> users;
}
我让User成为拥有方,这样JPA将跟踪对User.Roles的更改。
以下代码导致该问题:
User user = em.find(User.class, 1L);
Role role = em.find(Role.class, 1L);
// This line causes the issue
user.getRoles().add(role);
em.persist(user);
当我添加到用户角色时,执行以下SELECT操作:
select
roles0_.users_id as users_id1_20_0_,
roles0_.roles_id as roles_id2_21_0_,
role1_.id as id1_17_1_,
role1_.name as name2_17_1_
from User_Role roles0_
inner join Role role1_ on roles0_.roles_id=role1_.id
where roles0_.users_id=?
这对于较小的集合来说很好,但对于较大的集合就有问题。
我可以想到以下解决方案,我想知道我应该选择哪一个,或者是否有更好的方法来做到这一点?
1.执行本机查询:
INSERT INTO User_Role (users_id, roles_id) VALUES (1, 1)
2.为连接表创建实体:
@Entity
IdClass(UserRole.PK)
public class UserRole {
@Id
private User user;
@Id
private Role role;
public static class PK {
private User user;
private Role role;
}
}
然后我可以运行:
User user = em.find(User.class, 1L);
Role role = em.find(Role.class, 1L);
UserRole userRole = new UserRole(user, role);
em.persist(userRole);
我倾向于对INSERT使用原生查询,但我希望得到一些反馈,了解执行此操作的最‘JPA’方式是什么。
解决方案
《使用Hibernate的Java持久性》一书(第298页)指出,多对多通常最好使用关联类(有点像您在第二个解决方案中已有的UserRole),然后为两端映射两个一对多关系--即每个用户有多个UserRole,每个角色有多个UserRole。这是最"JPA"的做事方式,我想你会得到你想要的表现。
现在细微之处:
- 关联类应该有一个基于用户和角色的ID的组合键,而不是它自己的主键。本书给出了一个在Association类中创建一个@Embedble静态内部类的示例,该类包含两个主要类(在您的例子中是User和Role)的ID。这些ID到关联表中的列的映射是在这个内部类中完成的。
- 在您向其传递特定角色和用户的关联类的构造函数中,您将填充内部类,然后将"this"(即您正在创建的关联实例)添加到传入的用户和角色的集合中(例如,role.getUserRoles().add(This))。
- 删除关联时,必须同时从用户和角色中删除该关联。也就是说,在角色端,您将执行以下操作:role.getUserRoles().Remove(UserRole),然后您将在用户端执行相同的操作,然后删除关联:ession.ete(UserRole)。
如果您遵循这些步骤,Hibernate将知道正在发生的一切,并且您的缓存应该是好的。您还可以使用级联启用传递性持久性。
编辑:如上所述,这实际上并不会消除试图避免的查询。经过进一步思考,我没有一个可以消除查询的答案,但我可以指出为什么JPA的行为方式如您所见。在原始设置中,每一项都有其他内容的集。由于集合是唯一的,并且JPA提供程序遵循集合语义,因此它们必须确保关系是唯一的。因此,如果您添加一个关系,它必须进行查询以确保该关系不存在。它可以只查询您试图添加的关系,也可以查询整个集合,然后检查内部。如果您要将多个内容添加到集合中,则后者是更好的方法,而这正是他们针对此进行优化的原因。JPA提供程序永远不会做的一件事是,如果您试图添加重复的关系,JPA提供程序永远不会依赖于底层数据库约束--JPA提供程序更喜欢在Java层处理Java约束
Hibernate还支持袋子选项,该选项允许重复,因此可以避免检查...但这样,您的数据库中就会有重复的关系。
相关文章