在上面的例子中,我们可以确认大小写不敏感的查询会更实用一些。当处理英文以外的名字时,可以用无重音比较来优化:
>>> Author.objects.filter(name__unaccent__icontains='Helen')
[<Author: Helen Mirren>, <Author: Helena Bonham Carter>, <Author: Hélène Joy>]
这展开了另一个关于通过名字的不同拼写进行比较的讨论。但这种比较是不对称的 —— 筛选 Helen
能拿到 Helena
或 Hélène
,但反着来却不行。还有一个选项允许使用 trigram_similar
比较,这回比较字母的序列。
例如:
>>> Author.objects.filter(name__unaccent__lower__trigram_similar='Hélène')
[<Author: Helen Mirren>, <Author: Hélène Joy>]
现在还有一个问题 —— 名字 "Helena Bonham Carter" 有点太长了,以至于没有显示。三元搜索综合考虑了三种字母的所有组合形式,并同时再查询和源字符串中比较了出现的次数。对于长名字,源字符串中包含了更多的组合方式,所以其不再被认为是一种近似匹配。
要基于你提供的特定数据集合选择一个合适的比较函数,例如依据使用的语言和待搜索的文本。我们见过的所有例子都是关于短字符串的,这使得用户可以输入与源数据关联较大(根据不同的定义)的内容。
备案信息: 粤ICP备15087711号-2
Copyright © 2008-2024 啊嘎哇在线工具箱 All Rights.
本站所有资料来源于网络,版权归原作者所有,仅作学习交流使用,如不慎侵犯了您的权利,请联系我们。