在Django中使用ElasticSearch

Elasticsearch可以使我们快速,近乎实时地存储,搜索和分析大量数据,并在几毫秒内给出答复。之所以能够获得快速的搜索响应,是因为它可以直接搜索索引,而不是直接搜索文本。

什么是Elasticsearch?

Elasticsearch是基于Lucene库的搜索引擎。它提供了具有HTTP Web界面和无模式JSON文档的分布式,多租户功能的全文本搜索引擎。Elasticsearch是用Java开发的。

Elasticsearch的用途是什么?

Elasticsearch可以使我们快速,近乎实时地存储,搜索和分析大量数据,并在几毫秒内给出答复。之所以能够获得快速的搜索响应,是因为它可以直接搜索索引,而不是直接搜索文本。

Elasticsearch-一些基本概念

索引—不同类型的文档和文档属性的集合。例如,文档集可以包含社交网络应用程序的数据。

类型/映射-共享共享同一索引中存在的一组公共字段的文档集合。例如,索引包含社交网络应用程序的数据;对于用户个人资料数据,可以有一种特定的类型,对于消息传递数据,可以有另一种类型,对于注释数据,可以有另一种类型。

文档-以特定方式以JSON格式定义的字段的集合。每个文档都属于一种类型,并且位于索引内。每个文档都与唯一的标识符(称为UID)相关联。

字段-Elasticsearch字段可以包含多个相同类型的值(本质上是一个列表)。另一方面,在SQL中,一列可以恰好包含所述类型的一个值。

在Django中使用Elasticsearch

安装和配置,安装Django Elasticsearch DSL:

$ pip install django-elasticsearch-dsl

然后将django_elasticsearch_dsl添加到INSTALLED_APPS

必须在django设置中定义ELASTICSEARCH_DSL。

例如:

ELASTICSEARCH_DSL={  
   'default': {  
       'hosts''localhost:9200'  
   },  
}

声明要索引的数据,然后创建model:

# models.py  
class Category(models.Model):  
   name = models.CharField(max_length=30)  
   desc = models.CharField(max_length=100, blank=True)  
def __str__(self):  
   return '%s' % (self.name)  
要使该模型与Elasticsearch一起使用,请创建django_elasticsearch_dsl.Document的子类,在Document类中创建一个Index类以定义我们的Elasticsearch索引,名称,设置等,最后使用Registry.register_document装饰器注册该类。它需要在应用目录中的documents.py中定义Document类。
# documents.py  
from django_elasticsearch_dsl import Document  
from django_elasticsearch_dsl.registries import registry  
from .models import Category  
@registry.register_document  
class CategoryDocument(Document):  
   class Index:  
       name = 'category'  
   settings = {  
       'number_of_shards': 1,  
       'number_of_replicas': 0  
   }  
   class Django:  
        model = Category  
        fields = [  
            'name',  
            'desc',  
        ]  
填充:  
要创建和填充Elasticsearch索引和映射,请使用search_index命令:  
$python manage.py search_index — rebuild  
要获得更多帮助,请使用命令:  
$ python manage.py search_index —help  
现在,当执行以下操作时:  
category = Category(  
   name="Computer and Accessories",  
   desc="abc desc"  
)  
category.save()  
该对象也将保存在Elasticsearch中(使用信号处理程序)。  
搜索:  
要获取elasticsearch-dsl-py搜索实例,请使用:  
s = CategoryDocument.search().filter("term", name="computer")  
# or  
s = CategoryDocument.search().query("match", description="abc")  
for hit in s:  
   print(  
       "Category name : {}, description {}".format(hit.name, hit.desc)  
   )  
要将弹性搜索结果转换为真实的Django查询集,请注意,这会花费一个SQL请求来检索具有由Elasticsearch查询返回的ID的模型实例。  
s = CategoryDocument.search().filter("term", name="computer")[:30]  
qs = s.to_queryset()  
# qs is just a django queryset and it is called with order_by to keep  
# the same order as the elasticsearch result.  
for cat in qs:  
   print(cat.name)

完毕,如果有任何疑问,欢迎留言交流。

原创文章,作者:晴川运维,如若转载,请注明出处:https://baike.qcidc.com/5455.html

(0)
晴川运维晴川运维
上一篇 2025年6月8日
下一篇 2025年6月8日

相关推荐

  • 细说Shell test 命令

    Shell中的 test 命令用于检查某个条件是否成立,它可以进行数值、字符和文件三个方面的测试,下面为大家讲解一下Shell test 命令。 数值测试 参数 说明 -…

    Linux系统 2025年10月21日
  • 详解Shell脚本的条件测试和if条件语句

    本篇文章重点为大家讲解一下shell脚本的条件测试操作,并通过正确使用if语句,使Shell脚本具有一定的“判断”能力,以根据不同的条件来完成不同的管理任务。 一、条件测试操作 要…

    Linux系统 2025年9月23日
  • 深入探究一下Nginx如此之快的原因

    Nginx (“engine x”) 是一个高性能的 HTTP 和 反向代理 服务器 ,也是一个 IMAP/POP3/SMTP 代理 服务器 。 Nginx 是由 Igor Sys…

    Linux系统 2025年6月10日
  • 如何备份一个磁盘分区

    通常你可能会把数据放在一个分区上,有时候可能需要对该设备或者上面的一个分区进行备份。树莓派用户为了可引导 SD 卡当然有这个需求。其它小体积计算机的用户也会发现这非常有用。有时候设…

    Linux系统 2025年6月8日
  • C++中double类型保留三位小数点

    我们知道C语言中,如果要求输出结果保留三位小数,我们可以使用pritf()函数轻松的解决。但是的输出运算符 我以一个例子作为讲解: 已知线段的两个端点坐标是A(xa,ya),B(x…

    Linux系统 2025年6月8日
  • zabbix监控linux磁盘性能具体方法

    Zabbix 是一个企业级分布式开源监控解决方案,能够监控众多网络参数和服务器的健康度、完整性,使用灵活的告警机制,允许用户为几乎任何事件配置基于邮件的告警。这样用户可以快速响应服…

    Linux系统 2025年10月22日
  • OpenSSL 在 Apache 和 Dovecot 下的使用(二)

    本篇中,Carla Schroder 会解释如何使用 OpenSSL 保护你的 Postfix/Dovecot 邮件服务器 在上周,作为我们 OpenSSL 系列的一部分,我们学习…

    Linux系统 2025年7月3日
  • Linux下安装与配置APF防火墙

    APF是一款Linux下的iptables防火墙,由R-fx Networks开发维护,实现代码基本为SHELL。个人觉得这是Linux下最易用,且强大的防火墙脚本。类似级别的还有…

    Linux系统 2025年9月19日
  • springboot 配置DRUID数据源具体流程

    Druid首先是一个数据库连接池。Druid是目前最好的数据库连接池,在功能、性能、扩展性方面,都超过其他数据库连接池,包括DBCP、C3P0、BoneCP、Proxool、JBo…

    Linux系统 2025年10月19日
  • Python中实现线程同步

    python中如何实现线程同步?所谓的线程同步机制其实就是锁的使用,下面为大家详细讲解一下python中实现线程同步具体方法。 使用 Thread 对象的 Lock 和 Rlock…

    Linux系统 2025年6月13日

发表回复

登录后才能评论