首页
分类
标签
归档
瞬间
剪影
留言板
圈子
友链
关于
1
Dify 平台部署教程
2
Android 存储访问框架的使用
3
RVM用国内镜像安装Ruby
4
RAG技术从入门到放弃
5
【Ruby on Rails】 Rails常用命令行
登录
Jack.Jia
累计撰写
97
篇文章
累计收获
30
个点赞
累计收获
7590
次访问
导航
首页
分类
标签
归档
瞬间
剪影
留言板
圈子
友链
关于
极客日记
莫愁前路无知己,天下谁人不识君。
标签
全文检索
简单理解倒排索引
倒排索引是一种高效的数据结构,广泛应用于搜索引擎和信息检索系统。它通过将文档中的单词映射到包含该单词的文档集合,实现快速检索。与正排索引相对,倒排索引将"文档→单词"的形式转为"单词→文档",并由单词词典和倒排列表两部分组成。文章详细阐述了倒排索引的构建过程、基本概念及示例,强调了其在信息检索和数据库系统中的重要应用价值。
2023-11-07
175
0
1
43.5℃
全文检索
Solr倒排索引学习
Solr是基于Lucene的搜索平台,其倒排索引由词典、倒排列表及频率/位置信息组成。索引用于高效存储文档词语及其位置信息,当新文档添加时,索引会更新以保持一致性。查询通过Solr API实现,检索倒排索引并返回结果。构建倒排索引的流程包括文档解析、字段分析、词条关联和写入提交。维护倒排索引时需同步变更,通过重建索引、增量更新、软提交和硬提交实现。SolrCloud集群支持主从节点的索引同步与管理。
2023-11-04
162
0
1
42.2℃
Solr
基于docker搭建SolrCloud环境
本文介绍了如何基于Docker搭建SolrCloud环境。首先,确保安装Docker和Docker Compose,然后创建一个`docker-compose.yml`文件,配置多个Solr和ZooKeeper容器。接着,构建自定义Solr镜像,并使用Docker Compose启动容器。最后,通过访问Solr管理界面配置Cloud集合,以便项目使用。这一过程确保了Solr的高可用性和可扩展性。
2023-09-28
189
0
1
44.9℃
Solr
Solr Suggest 学习
Solr的Suggest模块是提升用户体验和搜索准确性的关键功能,通过提供实时搜索建议、自动完成和拼写检查,快速返回与用户输入匹配的词或短语。Solr支持多种Suggester类型,如AnalyzingInfixLookupFactory和FuzzyLookupFactory,以满足不同需求。尽管其优点包括快速响应和高可定制性,但在处理大数据量时可能面临性能挑战。该功能在电商、新闻门户和内部知识库等多个场景中应用广泛,有助于改善搜索结果的准确性和召回率。
2023-09-04
173
0
1
43.3℃
Solr
Solr函数查询(补充)
Solr函数查询是一种强大的特性,使用户能够在搜索过程中执行计算和数据分析操作。本文深入探讨Solr的函数查询,包括内置函数和自定义函数的使用,提供基于Ruby的示例代码。通过函数查询,用户可以对文档进行评分、排序和过滤。文中特别提到一些基本和高级函数,如常量函数、字段引用函数,以及字符串和数学处理函数。示例展示了如何构建请求参数并处理返回结果,体现Solr在复杂检索需求中的灵活性和功能强大。
2023-09-04
171
0
1
43.1℃
Solr
SolrCloud 基本概念
Solr 集群类型包括单节点集群、分布式集群和 SolrCloud 集群。单节点集群适用于简单的开发环境,但存在单点故障风险和有限的可扩展性。分布式集群通过多个节点实现数据的水平扩展和负载均衡,提供高可用性,但配置复杂且增加网络开销。SolrCloud 提供高可用性、自动容错与恢复,适合大规模应用。其核心概念包括集群节点、集合、分片和副本,选择合适的配置是构建高性能系统的关键。
2023-09-03
167
0
1
42.7℃
Solr
弹