前言:
在做一个商城项目的时候,需要实现商品搜索功能。
说到搜索,第一时间想到的是数据库的 select * from tb_sku where name like %苹果手机%
或者django的 SKU.objects.filter(name__contains=”苹果手机”)
但是,假如你的数据库有几千万条数据,name字段没有索引,可能查询需要十几分钟,用户可能会等你?那为什么不给name字段增加索引?商品表不仅仅是用来查询,也会经常修改数据,新增删除数据等。建立索引后,做增删改操作时也会大大占用数据库资源。所以应该怎么解决呢?
Elasticsearch!
一个强大的基于Lucene的全文搜索服务器!维基百科、Stack Overflow、Github都在用。
如果想详细了解其原理的话,可以参考:Elasticsearch 基础介绍及索引原理分析
这里只是简单说一下他的原理。
Elasticsearch原理:
部署好ElasticSearch服务器后,刚开始需要创建索引,ES索引库会对数据库中的数据进行一遍预处理,单独建立起一份索引结构数据。
理解:
假如你的商品表里有这几个字段。id,名字,副标题,价格,商品图片链接地址,评论数,是否上架。
一般用户会根据名字或者副标题来搜索。此时名字、副标题这个字段就需要建立索引(当然,id也要,人家在mysql那里是主键总要给点面子吧)。但是后端返回给前端的数据,不仅仅是需要名字、副标题啊。你还要价格什么的呢!所以我们还要指定需要的字段,不然直接找个名字或者副标题出来有什么用?
所以刚开始创建索引库时,ElasticSearch服务端会根据我们指定要作为索引的字段(名字、副标题、id)、要返回的字段(价格…),同步一份到ES索引库里面。为什么要同步到elasticsearch?因为查找快呀。至于为什么ElasticSearch查找这么快,可以参考一下上面链接的原理。
注意上面的图,ElasticSearch是C/S架构的软件。下面说一下,服务端怎么搭建?
ElasticSearch服务端的搭建:
在搭建前说下,ElasticSearch建立索引时会分词。什么是分词呢?例如“我今天吃了一个汉堡包”。分词后是“我”、“今天”、“吃了”、“一个”、“汉堡包”。你以为ElasticSearch会这么智能?没错,它对英文是这么智能,但是对我们的中文,只会分成“我”、“今”、“天”、“吃”、“了”、“一”、“个”、“汉”、“堡”、“包”。这样用户还怎么搜索啊。。。所以我们需要一个在ElasticSearch服务端集成一个插件,ElasticSearch-ik插件。有了这个插件,真的可以这么智能了。
所以,带有-ik插件的ElasticSearch服务端怎么装呢?
太麻烦了,所以我选择docker(滑稽.jpg)
(1)加载docker镜像
sudo docker load -i elasticsearch-ik-2.4.6_docker.tar
(2)修改配置文件
elasticsearc-2.4.6/config/elasticsearch.yml第54行,更改ip地址为本机ip地址:
network.host: xxx.xxx.xxx.xxx
如果docker不是运行在开发环境的本机,可以设为0.0.0.0。表示允许所有ip访问此服务器。
(3)运行容器
docker run -d -p 9200:9200 --network=host --name=elasticsearch -v /var/elasticsearch-2.4.6/co<em style="color:transparent">本文来源[email protected]搞@^&代*@码)网9</em>nfig:/usr/share/elasticsearch/config delron/elasticsearch-ik:2.4.6-1.0