必须掌握的全文检索Lucene,带你一周从入门到精通搜索引擎!
专辑:Lucene (全文检索工具)从入门到精通 简介:Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。本专辑将带你从快速掌握Lucene全文检索工具! 课程目标 本课程面向初学搜索引擎及lucene的学员,带领大家进入搜索引擎领域 课程大纲 一、lucene简介 1.什么是lucene 2.全文检索流程 3.lucene索引搜索示例 实践操作实例: 1.索引示例 2.搜索示例 预期收获: 了解lucene的基本概念及搜索流程 二、lucene索引 1.Docuemnt对象 2.Field对象 3.Direcotry对象 4.IndexWriter对象 5.IndexWriter对象 实践操作实例: 创建索引 预期收获: 利用索引对象创建索引 三、lucene索引过程分析 1.创建索引的过程分析 2.了解Segment的概念 实践操作实例: 索引过程分析演示 预期收获: 了解创建索引的内部实现机制 四、lucene索引优化 lucene索引优化参数 实践操作实例: 演示各参数的概念 预期收获: 了解优化索引的参数及设置 五、lucene搜索 1.IndexSearch 2.QueryParser 3.Query 实践操作实例: 利用IndexSearch实现搜索 预期收获: 了解搜索流程 六、lucene query使用 1.TermQuery使用 2.FuzzyQuery 3.PrefixQuery 实践操作实例: 各query的构造及使用 预期收获: 了解query的使用及query之间的区别 七、lucene布尔查询 BooleanQuery 实践操作实例: BooleanQuery的使用 预期收获: 构建BooleanQuery 八、lucene过滤器 Filter抽象类 实践操作实例: 实现Filter,满足过滤查询需求 预期收获: 能利用Filter抽象类实现自定义过滤器功能