搜索
我们会引用与 执行查询 中一样的模型。
文本字段能通过匹配运算进行筛选。例如,你可能会这样查找一个作者:
这是一种非常简陋的方案,因为它要求用户必须知道用户名中包含的字符串。大小写不敏感的匹配 () 不失为一种更好的方案,但优化的程度有限。
若你使用的是 PostgreSQL,Django 提供了 数据特殊筛选工具 帮助你巧妙利用更复杂的查询条件。其它数据库也有不同的筛选工具,可能是通过插件或用户自定义函数实现的。Django 此时还没有为他们提供任何支持。我们会用来自 PostgreSQL 的实例来证明其包含的功能函数。
在其它数据库中搜索
在上面的例子中,我们可以确认大小写不敏感的查询会更实用一些。当处理英文以外的名字时,可以用 来优化:
这展开了另一个关于通过名字的不同拼写进行比较的讨论。但这种比较是不对称的 —— 筛选 能拿到 或 ,但反着来却不行。还有一个选项允许使用 trigram_similar 比较,这回比较字母的序列。
例如:
现在还有一个问题 —— 名字 “Helena Bonham Carter” 有点太长了,以至于没有显示。三元搜索综合考虑了三种字母的所有组合形式,并同时再查询和源字符串中比较了出现的次数。对于长名字,源字符串中包含了更多的组合方式,所以其不再被认为是一种近似匹配。
要基于你提供的特定数据集合选择一个合适的比较函数,例如依据使用的语言和待搜索的文本。我们见过的所有例子都是关于短字符串的,这使得用户可以输入与源数据关联较大(根据不同的定义)的内容。
- 词干化,这样 “pony” 和 “ponies” 会被认为是一样的。
- 根据不同的标准为单词设置权重,例如其在文本中出现的频率,或所属字段(如标题或关键字)的重要性。
使用搜索软件有很多选项,最常见的有 和 Solr。它们都是基于全文搜索的解决方案。要用它们搜索来自 Django 模型的数据,你需要一个抽象层,将数据(包括对数据库 id 的指针)转换为文本文档。当使用该引擎的某次搜索返回了一份文档,你可以在数据库中查看它。有很多第三方库被设计为处理这种问题。
PostgreSQL 支持
PostgreSQL 内置了其专属的全文本搜索实现。虽然并不像其它搜索引擎那样强大,但它的优点是内置在数据库中,所以它能很方便的与其它关联查询条件进行联合查询,如按分类查询。
django.contrib.postgres 模块提供了一些助手函数来执行这些查询。例如,查询可能筛选出所有提到了 “cheese” 的博客条目:
你也可以在联合字段或关联模型上进行筛选:
参阅 文档获取全部细节。