Django4 中文入门教程 Django4.0 搜索-一个更高级的数据库比较函数

2024-02-25 开发教程 Django4 中文入门教程 匿名 33

在上面的例子中,我们可以确认大小写不敏感的查询会更实用一些。当处理英文以外的名字时,可以用无重音比较来优化:

>>> Author.objects.filter(name__unaccent__icontains='Helen')
[<Author: Helen Mirren>, <Author: Helena Bonham Carter>, <Author: Hélène Joy>]

这展开了另一个关于通过名字的不同拼写进行比较的讨论。但这种比较是不对称的 —— 筛选 ​Helen ​能拿到 ​Helena ​或 ​Hélène​,但反着来却不行。还有一个选项允许使用 ​trigram_similar ​比较,这回比较字母的序列。
例如:

>>> Author.objects.filter(name__unaccent__lower__trigram_similar='Hélène')
[<Author: Helen Mirren>, <Author: Hélène Joy>]

现在还有一个问题 —— 名字 "Helena Bonham Carter" 有点太长了,以至于没有显示。三元搜索综合考虑了三种字母的所有组合形式,并同时再查询和源字符串中比较了出现的次数。对于长名字,源字符串中包含了更多的组合方式,所以其不再被认为是一种近似匹配。
要基于你提供的特定数据集合选择一个合适的比较函数,例如依据使用的语言和待搜索的文本。我们见过的所有例子都是关于短字符串的,这使得用户可以输入与源数据关联较大(根据不同的定义)的内容。