Apache Solr术语


在本章中,我们将尝试理解在使用Solr时经常使用的某些术语的真正含义。

一般术语

以下是所有类型的Solr设置中使用的一般术语列表 -

  • Instance - 就像 tomcat instancejetty instance ,这个术语指的是在JVM中运行的应用程序服务器。Solr的主目录提供对这些Solr实例的引用,其中可以将一个或多个核配置为在每个实例中运行。

  • Core - 在应用程序中运行多个索引时,每个实例中可以有多个核心,而不是每个具有一个核心的多个实例。

  • Home - 术语$ SOLR_HOME指的是主目录,其中包含有关内核及其索引,配置和依赖关系的所有信息。

  • Shard - 在分布式环境中,数据在多个Solr实例之间进行分区,其中每个数据块都可以作为碎片 调用。它包含整个索引的子集。

SolrCloud术语

在前面的章节中,我们讨论了如何在独立模式下安装Apache Solr。请注意,我们还可以在分布式模式(云环境)中安装Solr,其中Solr以主从模式安装。在分布式模式下,索引在主服务器上创建,并复制到一个或多个从属服务器。

与Solr Cloud相关的关键术语如下

  • Node - 在Solr云中,Solr的每个单个实例都被视为一个节点。

  • Cluster - 环境的所有节点组合在一起构成 群集 。

  • Collection - 集群具有称为集合的逻辑索引。

  • Shard - 碎片是集合的一部分,它具有索引的一个或多个副本。

  • Replica - 在Solr Core中,在节点中运行的分片副本称为副本 。

  • Leader - 它也是分片的副本,它将Solr Cloud的请求分发给剩余的副本。

  • Zookeeper - 这是一个Apache项目,Solr Cloud用于集中配置和协调,管理集群和选举领导者。

配置文件

Apache Solr中的主要配置文件如下

  • Solr.xml - 它是$ SOLR_HOME目录中包含Solr Cloud相关信息的文件。 要加载核心,Solr会引用此文件,这有助于识别它们。

  • Solrconfig.xml - 此文件包含与请求处理和响应格式相关的定义和特定于核心的配置,以及索引,配置,管理内存和进行提交。

  • Schema.xml - 此文件包含整个架构以及字段和字段类型。

  • Core.properties - 此文件包含特定于核心的配置。 它被称为核心发现,因为它包含核心名称和数据目录的路径。它可以在任何目录中使用,然后将其视为 核心目录