Python语言技术文档

微信小程序技术文档

php语言技术文档

jsp语言技术文档

asp语言技术文档

C#/.NET语言技术文档

html5/css技术文档

javascript

点击排行

您现在的位置:首页 > 技术文档 > Python网站web

Django实现全文检索的方法(支持中文)

来源:中文源码网    浏览:263 次    日期:2024-05-16 13:32:14
【下载文档:  Django实现全文检索的方法(支持中文).txt 】


Django实现全文检索的方法(支持中文)
PS: 我的检索是在文章模块下 forum/article
第一步:先安装需要的包:
pip install django-haystack
pip install whoosh
pip install jieba
第二步: 配置需要的文件 settings.py
添加haystack应用模块
INSTALLED_APPS = (
...
'haystack',
...
)
在settings.py 末尾添加
HAYSTACK_CONNECTIONS = {
'default': {
'ENGINE': 'article.whoosh_cn_backend.WhooshEngine',
'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
},
}
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' # 索引自动更新
第三步: 配置url路径
在 forum/forum/urls.py中包含search路径
url(r'^search/', include('haystack.urls')),
第四步:建立模型
forum/article/models.py
class Article(models.Model):
'''
文章数据模型
'''
id = models.AutoField(primary_key=True,verbose_name='文章编号')
title = models.CharField(max_length=50,verbose_name='文章标题')
content = MDTextField()
publish_time = models.DateTimeField(auto_now_add=True,verbose_name='发表时间')
last_update_time = models.DateTimeField(auto_now=True,verbose_name='最后一次修改时间')
status = models.IntegerField(u'状态', default=1)
read_count = models.IntegerField(default=0,verbose_name='阅读次数')
comment_count = models.IntegerField(default=0,verbose_name='评论次数')
#关联用户
user = models.ForeignKey(User,on_delete=models.CASCADE,verbose_name='用户')
subject = models.ForeignKey(Subject, null=True, blank=True, on_delete=models.CASCADE,
verbose_name='属于哪一个专题')
第五步:设置为那个class建立索引
如果你想针对某个app例如mainapp做全文检索,则必须在mainapp的目录下面建立search_indexes.py文件,文件名不能修改
例:forum/article/search_indexes.py模块
from article.models import Article
from haystack import indexes
class ArticleIndex(indexes.SearchIndex, indexes.Indexable):
text = indexes.CharField(document=True, use_template=True)
def get_model(self):
return Article
def index_queryset(self, using=None):
return self.get_model().objects.filter(status=1)
每个索引里面必须有且只能有一个字段为document=True
第六步: 确定我们需要的属性:
新建yourapp/templates/search/indexes/yourapp/article_text.txt来指明需要属性
例: article/templates/search/indexes/yourapp/article_text.txt
{{ object.title }} # 文章标题
{{ object.user.username }} # 文章作者
{{ object.content }} # 文章内容
第七步: 把搜索引擎放入项目下
例: forum/article/whoosh_cn_backend.py
将文件whoosh_backend.py(例: 我的python路径E:\python\Lib\site-packages\haystack\backends\whoosh_backend.py
)放到article下,并重命名为whoosh_cn_backend.py,例如blog/whoosh_cn_backend.py。修改如下:
导入
from jieba.analyse import ChineseAnalyzer
找到
复制代码 代码如下:schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer(), field_boost=field_class.boost, sortable=True)
然后将其修改为
复制代码 代码如下:schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=ChineseAnalyzer(), field_boost=field_class.boost, sortable=True)
成功引入jieba分词
第八步: 前端页面配置
templates/base.html (搜索页面)

结果展示页面(forum/article/templates/search/search.html)
{% extends 'base.html' %}
{% block title %}搜索结果{% endblock %}
{% block content %}


















{% if query %}

搜索结果




{% for result in page.object_list %}


{% empty %}

没有得到想要的结果哦.


{% endfor %}



{{ result.object.title }}

作者: {{ result.object.user.username }}

{{ result.object.content | safe | truncatechars_html:40 }}



{% if page.has_previous or page.has_next %}

{% if page.has_previous %}{% endif %}« 上一页{% if page.has_previous %}{% endif %}
|
{% if page.has_next %}{% endif %}下一页 »{% if page.has_next %}{% endif %}

{% endif %}
{% else %}
{# Show some example queries to run, maybe query syntax, something else? #}
{% endif %}


{% endblock %}
第九步: 建立索引
python manage.py rebuild_index
建立成功会自行生成一个forum/whoosh_index的文件夹
第十步: 运行程序
python manage.py runserver
PS: 模板样式可以自行调整
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持中文源码网。

相关内容