姜戈:如何获取多条过滤查询最相似的记录

2022-03-16 00:00:00 python django django-queryset

问题描述

我有一个消费品数据库,我需要根据他们的规格过滤。这些查询可以过滤多达10种不同类型的字段。这通常不会导致完全匹配。当没有完全匹配的产品时,我想退回最相似的产品。我认为最简单的方法是为与过滤匹配的每一列添加注释。然后按数量最多的产品订购。有什么办法可以做到这一点吗?或者,有没有其他方法可以与Django获得类似的匹配?

例如,如果我有以下查询:

Laptop.objects.filter(brand='Dell', ram=8, price__lte=1000, screen_size=13.3)

如果查询集为空,我希望返回这4个筛选器中具有最匹配字段的笔记本电脑。


解决方案

我遇到的一个丑陋的解决方案是将几个调用链接到annotate(),为每个匹配递增相同的注释

from django.db.models import Value, F, Case, When, IntegerField

annotated_laptops = Laptop.objects.annotate(
    matches=Value(0)
).annotate(
    matches=Case(When(brand='Dell', then=F('matches') + 1), default=F('matches'), output_field=IntegerField())
).annotate(
    matches=Case(When(ram=8, then=F('matches') + 1), default=F('matches'), output_field=IntegerField())
).annotate(
    matches=Case(When(price__lte=1000, then=F('matches') + 1), default=F('matches'), output_field=IntegerField())
).annotate(
    matches=Case(When(screen_size=13.3, then=F('matches') + 1), default=F('matches'), output_field=IntegerField())
)

然后,查询集中的每一行都将使用匹配列数进行批注,这可用于过滤或ORDER BY

laptops = annotated_laptops.filter(matches=4)
if laptops.count() == 0:
    laptops = annotated_laptops.order_by('-matches')

相关文章