京东架构师的ES笔记分享


话不多说,直接上内容:

第1章:Elasticsearch简介

先介绍Apache Lucene的工作方式,再介绍Elasticsearch的基本概念,并演示Elasticsearch内部是如何工作的。

第2章:查询DSL进阶

描述Lucene评分过程,为什么要进行查询改写,什么是查询模板以及如何使用查询模板。除此之外,还介绍了过滤器的使用,以及如何为特定场景选择合适的查询方式。

第3章:不只是文本搜索

描述了查询二次评分、多匹配控制,并介绍了用于做查询分析的各种聚合类型。关键词项聚合和最优词项聚合可以根据所含内容片段对文档进行归类。除此之外,还介绍了Elasticsearch的parent- child文档关系处理,并提供了在Elasticsearch中使用脚本的相关知识。

第4章:改善用户搜索体验

覆盖了有关用户体验提升的相关话题。本章介绍了查询建议( suggester),它能帮助修正查询中的拼写错误并构建高效的自动完成( autocomplete)机制。除此之外,通过实际的案例展示如何通过使用不同查询类型和Elasticsearch的其他功能来提高查询相关性。

第5章:分布式索引架构

介绍了以下技术:如何选择合适的分片及副本数,路由是如何工作的,索引分片机制是如何工作的以及如何影响分片行为。同时介绍了什么是查询执行偏好,以及它是如何影响查询执行的。

第6章:底层索引控制

描述如何修改Lucene评分以及如何选择备用的评分算法。本章也介绍了Elasticsearch的准实时搜索和索引,事务日志的使用,理解索引的段合并,以及如何调整段合并来适应应用场景。在本章最后,还将介绍Elasticsearch的缓存机制和请求打断器,以避免出现内存用尽的故障。

第7章:管理 Elasticsearch

介绍了什么是发现、网关、恢复模块,如何配置这些模块,以及有哪些令人心烦的疑难点。还介绍了什么是Cat API,如何把数据备份到各种云服务上(比如亚马逊的AWS和微软的Azure),以及如何从云服务上恢复数据。最后还介绍了如何使用部落节点进行联盟搜索。

第8章:提高性能

覆盖了与Elasticsearch性能相关的各种主题,从使用文档取值来优化字段数据缓存的内存使用,到JVM垃圾回收器的工作原理,再到查询基准测试,最后到如何扩展Elasticsearch以适应更高的索引量和查询量场景。

第9章:开发Elasticsearch 插件

通过演示如何开发你自己的REST操作插件和查询语言分析插件来介绍Elasticsearch的插件开发。


原文链接:https://www.cnblogs.com/jiagoushijuzi/p/13537586.html