内容简介:
Java文档搜索引擎
项目运行效果
一、简述搜索引擎概念
二、搜索引擎实现思路
2.1倒排索引介绍
2.2项目目标
2.3获取java文档
2.4模块划分
2.5创建项目
2.6认识分词
2.7分词的原理
2.8使用第三方分词库
三、实现索引模块-parser类
3.1 实现索引模块-递归枚举文件
3.2 排除非HTML文件
3.3 实现索引模块-解析HTML
3.4 实现索引模块-解析标题
3.5 实现索引模块-解析url的思路
3.6 实现索引模块-解析url代码实现
3....
查看原文
暂无评论...