Django实现全文检索的方法(支持中文)


Posted in Python onMay 14, 2018

PS: 我的检索是在文章模块下 forum/article

第一步:先安装需要的包:

pip install django-haystack
pip install whoosh
pip install jieba

第二步: 配置需要的文件 settings.py

添加haystack应用模块

INSTALLED_APPS = (
   ...
  'haystack',
   ...
)

在settings.py 末尾添加

HAYSTACK_CONNECTIONS = {
  'default': {
    'ENGINE': 'article.whoosh_cn_backend.WhooshEngine',
    'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
  },
}
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'  # 索引自动更新

第三步: 配置url路径

在 forum/forum/urls.py中包含search路径

url(r'^search/', include('haystack.urls')),

第四步:建立模型

forum/article/models.py

class Article(models.Model):
  '''
  文章数据模型
  '''
  id = models.AutoField(primary_key=True,verbose_name='文章编号')
  title = models.CharField(max_length=50,verbose_name='文章标题')
  content = MDTextField()
  publish_time = models.DateTimeField(auto_now_add=True,verbose_name='发表时间')
  last_update_time = models.DateTimeField(auto_now=True,verbose_name='最后一次修改时间')
  status = models.IntegerField(u'状态', default=1) 
  read_count = models.IntegerField(default=0,verbose_name='阅读次数')
  comment_count = models.IntegerField(default=0,verbose_name='评论次数')

  #关联用户
  user = models.ForeignKey(User,on_delete=models.CASCADE,verbose_name='用户')
  subject = models.ForeignKey(Subject, null=True, blank=True, on_delete=models.CASCADE,
                verbose_name='属于哪一个专题')

第五步:设置为那个class建立索引

如果你想针对某个app例如mainapp做全文检索,则必须在mainapp的目录下面建立search_indexes.py文件,文件名不能修改
例:forum/article/search_indexes.py模块

from article.models import Article
from haystack import indexes


class ArticleIndex(indexes.SearchIndex, indexes.Indexable):

  text = indexes.CharField(document=True, use_template=True)

  def get_model(self):
    return Article

  def index_queryset(self, using=None):
    return self.get_model().objects.filter(status=1)

每个索引里面必须有且只能有一个字段为document=True

第六步: 确定我们需要的属性:

新建yourapp/templates/search/indexes/yourapp/article_text.txt来指明需要属性

例: article/templates/search/indexes/yourapp/article_text.txt

{{ object.title }} # 文章标题
{{ object.user.username }} # 文章作者
{{ object.content }} # 文章内容

第七步: 把搜索引擎放入项目下

例: forum/article/whoosh_cn_backend.py

将文件whoosh_backend.py(例: 我的python路径E:\python\Lib\site-packages\haystack\backends\whoosh_backend.py
)放到article下,并重命名为whoosh_cn_backend.py,例如blog/whoosh_cn_backend.py。修改如下:

导入 

from jieba.analyse import ChineseAnalyzer

找到

schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer(), field_boost=field_class.boost, sortable=True)

然后将其修改为

schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=ChineseAnalyzer(), field_boost=field_class.boost, sortable=True)

成功引入jieba分词

第八步: 前端页面配置

templates/base.html (搜索页面)

<form class="navbar-form navbar-left" action="/search/" method="get">
        <div class="form-group">
          <input type="text" class="form-control" name="q" placeholder="请输入搜索的内容" value=""/>
        </div>
        <input type="submit" value="搜索">
      </form>

结果展示页面(forum/article/templates/search/search.html)

{% extends 'base.html' %}

{% block title %}搜索结果{% endblock %}

{% block content %}
<div class="container" id="content">
  <div class="search-body">

  <form method="get" action="">
    <table>
      <tr>
        <td>
          <label for="id_q"></label>
        </td>
        <td>
          <input class="form-control" id="id_q" name="q" type="search" value="{{ query }}" />
        </td>

        <td> </td>
        <td>
          <button class="btn btn-defaul" type="submit"><span class="glyphicon glyphicon-search">搜索</span></button>
        </td>
      </tr>


    </table>
</form>
    {% if query %}
      <h3>搜索结果</h3>

      <table class="table">
      <tr>

         {% for result in page.object_list %}
           <td>
        <p>
          <a href="{% url 'article:article_detail' article_id=result.object.id %}" rel="external nofollow" >
            {{ result.object.title }}</a>
        </p> 作者: <a href="{% url 'user:user_index' result.object.user.id %}" rel="external nofollow" >{{ result.object.user.username }}</a>
        <p>{{ result.object.content | safe | truncatechars_html:40 }}</p>
      </td>
      </tr>

      {% empty %}
        <p>没有得到想要的结果哦.</p>
      {% endfor %}
      </table>


      {% if page.has_previous or page.has_next %}
        <div>
          {% if page.has_previous %}<a href="?q={{ query }}&page={{ page.previous_page_number }}" rel="external nofollow" >{% endif %}« 上一页{% if page.has_previous %}</a>{% endif %}
          |
          {% if page.has_next %}<a href="?q={{ query }}&page={{ page.next_page_number }}" rel="external nofollow" >{% endif %}下一页 »{% if page.has_next %}</a>{% endif %}
        </div>
      {% endif %}
    {% else %}
      {# Show some example queries to run, maybe query syntax, something else? #}
    {% endif %}


  </div>

</div>
{% endblock %}

第九步: 建立索引

python manage.py rebuild_index

建立成功会自行生成一个forum/whoosh_index的文件夹

第十步: 运行程序

python manage.py runserver

PS: 模板样式可以自行调整

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的简单万年历例子分享
Apr 25 Python
python访问系统环境变量的方法
Apr 29 Python
Python Property属性的2种用法
Jun 21 Python
Python对象转JSON字符串的方法
Apr 27 Python
Python cookbook(数据结构与算法)实现优先级队列的方法示例
Feb 18 Python
kafka-python批量发送数据的实例
Dec 27 Python
python模拟键盘输入 切换键盘布局过程解析
Aug 15 Python
Python Django 封装分页成通用的模块详解
Aug 21 Python
python_mask_array的用法
Feb 18 Python
keras 自定义loss层+接受输入实例
Jun 28 Python
Python爬取微信小程序通用方法代码实例详解
Sep 29 Python
在 Python 中利用 Pool 进行多线程
Apr 24 Python
如何用python整理附件
May 13 #Python
Python基于dom操作xml数据的方法示例
May 12 #Python
Python实现使用卷积提取图片轮廓功能示例
May 12 #Python
在cmd中运行.py文件: python的操作步骤
May 12 #Python
对命令行模式与python交互模式介绍
May 12 #Python
python执行系统命令后获取返回值的几种方式集合
May 12 #Python
在CMD命令行中运行python脚本的方法
May 12 #Python
You might like
APMServ使用说明
2006/10/23 PHP
Drupal7连接多个数据库及常见问题解决
2014/03/02 PHP
Symfony页面的基本创建实例详解
2015/01/26 PHP
php实现数组重复数字统计实例
2018/09/30 PHP
解决在laravel中leftjoin带条件查询没有返回右表为NULL的问题
2019/10/15 PHP
js 获取浏览器版本以此来调整CSS的样式
2014/06/03 Javascript
JavaScript动态提示输入框输入字数的方法
2015/07/27 Javascript
基于jQuery全屏焦点图左右切换插件responsiveslides
2015/09/07 Javascript
微信小程序 UI与容器组件总结
2017/02/21 Javascript
JavaScript实现随机数生成器(去重)
2017/10/13 Javascript
微信小程序整合使用富文本编辑器的方法详解
2019/04/25 Javascript
Vue实现数据表格合并列rowspan效果
2020/11/30 Javascript
详解Vuex下Store的模块化拆分实践
2019/07/31 Javascript
Angular短信模板校验代码
2020/09/23 Javascript
vue 数据双向绑定的实现方法
2021/03/04 Vue.js
使用Python判断质数(素数)的简单方法讲解
2016/05/05 Python
浅谈对yield的初步理解
2017/05/29 Python
Python配置mysql的教程(推荐)
2017/10/13 Python
python+tkinter编写电脑桌面放大镜程序实例代码
2018/01/16 Python
浅谈Django中的数据库模型类-models.py(一对一的关系)
2018/05/30 Python
使用Python实现牛顿法求极值
2020/02/10 Python
浅谈Pytorch torch.optim优化器个性化的使用
2020/02/20 Python
Pycharm中import torch报错的快速解决方法
2020/03/05 Python
Html5画布_动力节点Java学院整理
2017/07/13 HTML / CSS
印尼网上商店:Alfacart.com
2019/03/11 全球购物
韩语专业本科生求职信
2013/10/01 职场文书
师范生实习自我鉴定
2013/11/01 职场文书
中层干部培训方案
2014/06/16 职场文书
求职自我推荐信
2014/06/25 职场文书
先进事迹材料怎么写
2014/12/30 职场文书
写给妈妈的感谢信
2015/01/22 职场文书
语文教师个人工作总结
2015/02/06 职场文书
浅谈如何写好演讲稿?
2019/06/12 职场文书
elasticSearch-api的具体操作步骤讲解
2021/06/28 Java/Android
MySQL如何快速创建800w条测试数据表
2022/03/17 MySQL
Python使用socket去实现TCP客户端和TCP服务端
2022/04/12 Python