最佳做法是在添加到@ManyToMany的所有者端集合时避免选择所有行

2022-08-03 00:00:00 many-to-many sql java Hibernate jpa

当添加到表示@ManyToMany关联的所属方的集合时，我的JPA实现(Hibernate)将首先选择关联中的所有行，以确定该实体是否已经存在于集合中。

我了解这背后的机制，但在处理大型连接表时，这不是很好的性能。当我知道需要插入条目时，避免加载连接表的所有元素的最佳做法是什么？

我将以一个典型的用户/角色场景为例，为简洁起见，省略了getters/setters/初始化式：

@Entity
public class User {
    @Id
    private Long id;

    @ManyToMany
    private Set<Role> roles;
}

@Entity
public class Role {
    @Id
    private Long id;

    private String name;

    @ManyToMany(mappedBy = "roles")
    private Set<User> users;
}

我让User成为拥有方，这样JPA将跟踪对User.Roles的更改。

以下代码导致该问题：

User user = em.find(User.class, 1L);
Role role = em.find(Role.class, 1L);

// This line causes the issue
user.getRoles().add(role);

em.persist(user);

当我添加到用户角色时，执行以下SELECT操作：

select
     roles0_.users_id as users_id1_20_0_,
     roles0_.roles_id as roles_id2_21_0_,
     role1_.id as id1_17_1_,
     role1_.name as name2_17_1_ 
from User_Role roles0_ 
inner join Role role1_ on roles0_.roles_id=role1_.id 
where roles0_.users_id=?

这对于较小的集合来说很好，但对于较大的集合就有问题。

我可以想到以下解决方案，我想知道我应该选择哪一个，或者是否有更好的方法来做到这一点？

1.执行本机查询：

INSERT INTO User_Role (users_id, roles_id) VALUES (1, 1)

2.为连接表创建实体：

@Entity
IdClass(UserRole.PK)
public class UserRole {
    @Id
    private User user;
    @Id
    private Role role;

    public static class PK {
        private User user;
        private Role role;
    }
}

然后我可以运行：

User user = em.find(User.class, 1L);
Role role = em.find(Role.class, 1L);
UserRole userRole = new UserRole(user, role);
em.persist(userRole);

我倾向于对INSERT使用原生查询，但我希望得到一些反馈，了解执行此操作的最‘JPA’方式是什么。

解决方案

《使用Hibernate的Java持久性》一书(第298页)指出，多对多通常最好使用关联类(有点像您在第二个解决方案中已有的UserRole)，然后为两端映射两个一对多关系--即每个用户有多个UserRole，每个角色有多个UserRole。这是最"JPA"的做事方式，我想你会得到你想要的表现。

现在细微之处：

关联类应该有一个基于用户和角色的ID的组合键，而不是它自己的主键。本书给出了一个在Association类中创建一个@Embedble静态内部类的示例，该类包含两个主要类(在您的例子中是User和Role)的ID。这些ID到关联表中的列的映射是在这个内部类中完成的。
在您向其传递特定角色和用户的关联类的构造函数中，您将填充内部类，然后将"this"(即您正在创建的关联实例)添加到传入的用户和角色的集合中(例如，role.getUserRoles().add(This))。
删除关联时，必须同时从用户和角色中删除该关联。也就是说，在角色端，您将执行以下操作：role.getUserRoles().Remove(UserRole)，然后您将在用户端执行相同的操作，然后删除关联：ession.ete(UserRole)。

如果您遵循这些步骤，Hibernate将知道正在发生的一切，并且您的缓存应该是好的。您还可以使用级联启用传递性持久性。

编辑：如上所述，这实际上并不会消除试图避免的查询。经过进一步思考，我没有一个可以消除查询的答案，但我可以指出为什么JPA的行为方式如您所见。在原始设置中，每一项都有其他内容的集。由于集合是唯一的，并且JPA提供程序遵循集合语义，因此它们必须确保关系是唯一的。因此，如果您添加一个关系，它必须进行查询以确保该关系不存在。它可以只查询您试图添加的关系，也可以查询整个集合，然后检查内部。如果您要将多个内容添加到集合中，则后者是更好的方法，而这正是他们针对此进行优化的原因。JPA提供程序永远不会做的一件事是，如果您试图添加重复的关系，JPA提供程序永远不会依赖于底层数据库约束--JPA提供程序更喜欢在Java层处理Java约束

Hibernate还支持袋子选项，该选项允许重复，因此可以避免检查...但这样，您的数据库中就会有重复的关系。

相关文章