GitHub - EricJavaStudio/lucene: 基于lucene与IKAnalyzer的中文搜索demo及学习记录

EricJavaStudio/lucene

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
src/main		src/main
suggest		suggest
.gitignore		.gitignore
README.md		README.md
pom.xml		pom.xml

Repository files navigation

lucene

基于lucene与IKAnalyzer的中文搜索demo及学习记录

Lucene是apache下的一个开放源代码的全文检索引擎工具包。提供了完整的查询引擎和索引引擎,部分文本分析引擎。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能。

IKAnalyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包最初,它是以开源项目 Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。

开发环境及项目框架介绍

IDE:Intellij IDEA
数据库:MySQL,建立名为lucene的数据库, (数据库代码baike.sql)
项目框架:SpringBoot + lucene 6.6.5 + IKAnalyzer 2012FF
- lucene 6.6.5:http://www.apache.org/dyn/closer.lua/lucene/java/6.6.5
- IKAnalyzer 2012FF:https://gitee.com/wltea/IK-Analyzer-2012FF

学习记录

数据准备

介绍以下俩种初始数据的方式:

1、通过数据库代码baike.sql中的数据作为初始数据
2、通过Python爬取百度百科的词条数据作为本搜索的基础数据,爬取介绍及操作方式见PythonSpider

项目运行

1、修改config.yml文件,修改索引生成的目录
2、开启MySQL服务
3、启动服务:Run SearchApp
4、生成索引:访问http://localhost:8080/index?limit=10000&offset=0

 @GetMapping("/index")
 public String createIndex(int limit,int offset) {
 // 拉取数据
 List<Baike> baikes = baikeMapper.getAllBaike(limit,offset);
 seargitchService.write(baikes);
 return "成功";
 }

5、搜索界面地址:http://localhost:8080/search

 //搜索,实现高亮
 @GetMapping("search/{q}")
 public List<Map> getSearchText(@PathVariable String q) throws Exception {
 List<Map> mapList = searchDataBase.search("summary", q);
 return mapList;
 }

运行效果

About

基于lucene与IKAnalyzer的中文搜索demo及学习记录

Releases

No releases published

Packages

No packages published

Languages

TSQL 95.2%
Java 3.0%
JavaScript 1.3%
Other 0.5%

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

EricJavaStudio/lucene

Folders and files

Latest commit

History

Repository files navigation

lucene

开发环境及项目框架介绍

学习记录

数据准备

项目运行

运行效果

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Languages

EricJavaStudio/lucene

Folders and files

Latest commit

History

Repository files navigation

lucene

开发环境及项目框架介绍

学习记录

数据准备

项目运行

运行效果

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages