java搜索引擎源代码（开源的搜索引擎代码）

admin 发布：2022-12-19 02:55 104

今天给各位分享java搜索引擎源代码的知识，其中也会对开源的搜索引擎代码进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、跪求一个java的新闻搜索引擎的源代码
2、java如何实现搜索功能。比如，输入txt就能搜索出这个文件夹内所有txt格式的文件。请给完整代码。
3、怎么用java 开发一个搜索引擎呀？
4、求基于JAVA设计的搜索引擎代码。

跪求一个java的新闻搜索引擎的源代码

下载solr3.5服务器下来，里面有example例子，再百度“solr 3.5配置”，会出来 “solr 3.5 配置及应用” 的列表，你照着里面配置好，就可以基于服务器进行搜索了，网上现成的例子是没有的，当时我用的时候也找了好久

java搜索引擎源代码（开源的搜索引擎代码）

java如何实现搜索功能。比如，输入txt就能搜索出这个文件夹内所有txt格式的文件。请给完整代码。

import java.io.*;

public class FileDemo{

public static void main(String[] args)throws Exception{

//第一个参数是文件路径，第二个参数是要搜索的文件扩展名

getFile("D:\\JavaDemo",".txt");

}

private static void getFile(String pathName, final String endsWith)throws Exception{

File file = new File(pathName);

if(!file.exists())

throw new RuntimeException("文件不存在,你检索个P呀。");

file.listFiles(new FileFilter(){

public boolean accept(File file){

if(file.getName().endsWith(endsWith)){

System.out.println(file.getName());

return true;

}else

return false;

}

});

}

怎么用java 开发一个搜索引擎呀？

一．创建索引

1．一般创建索引的核心步骤

（1）. 创建索引写入对象IndexWriter：

IndexWriter indexWriter = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),create);

参数说明：INDEX_STORE_PATH：索引文件存放路径

new StandardAnalyzer()：分词工具

create：此参数为Boolean型，true表示重新创建整个索引， false 表示增量式创建索引。

（2）．创建文档模型,并用IndexWriter对象写入

Document doc = new Document();

Field field1 = new Field(fieldName1, fieldValue , Field.Store.YES, Field.Index.TOKENIZED);

doc.add(field1);

Field field2 = new Field(fieldName2, fieldValue , Field.Store.YES, Field.Index.TOKENIZED);

doc.add(field2)；

……

indexWriter.addDocument(doc);

indexWriter.close();

参数说明：

Document ：负责搜集数据源,它可以从不同的物理文件提取数据并放入同一个Document 中或从一个物理文件中提取出不同的数据并放入同一个Document中。

如下图所示

Field ：用来表示不同的数据源

fieldName1: 表示field名称

fieldValue: 表示field 的值

Field.Store.YES,：表示是否在索引文件中完整的存储该值。

在创建索引时，有些内容需要以摘要的形式完整地或以片段的方式显示在页面上，来便于用户查找想要的记录，那么就应该选择存储,如果不需要完整或片段的显示就不需要存储。

Field.Index.TOKENIZED ：表示是否索引和分词。

只要是需要当作关键字让用户查找的字段就需要建立索引。

在建立索引的过程中，如果像文章标题、文章内容这样的Field, 一般是靠用户输入几个关键字来查询的，就应该选择分词。

如果需要用户输入完整字符也就是精确查找才能查询到的，例如：beanName，就可以不分词。

Document最直观的理解方式：

Document就相当于我们平台中的一个普通javaBean,，而Field 就是javaBean中的一个属性。lucene搜索的机制就是靠搜索指定的Field的值，来得到含有要搜索内容的Document 集合，所以问题的关键在于如何组织Document .

2．结合平台创建索引的思路

(1) 经分析搜索元素应该由如下内容组成（Document的属性）

(2) 数据库数据转化为Document 的构造过程：

JavaBean / Attachment → (Temp Object) BaseData → (Finally Object) Document

分析：

要建立索引的源数据分为两大部分：一个是数据库数据 BeanData ,另一个是附件数据 FileData , 这样可以建立一个抽象类 BaseData , 来存放它们共有的属性。同时为了管理这些相应的数据，在相同的等级结构上，建立了相应的管理类（xxxDataManager），对这些数据类的操作（建立或删除索引）进行管理，并用一个工厂类(DataManagerFactory)来创建所需要的管理类，IndexHelper用来充当整个索引模块对外的接口，为了实现一些与平台特定的业务，特用SupportManager来提供一些额外的业务支持，索引模块代码结构如下图所示。

二．搜索索引

1. lucene 搜索的核心步骤：

String[] fields = {“title”, “summary”,……}; //要查找的field范围

BooleanClause.Occur[] flags = {BooleanClause.Occur.SHOULD, BooleanClause.Occur. MUST ,……};

Query query = MultiFieldQueryParser.parse(queryStr, fields,flags,new StandardAnalyzer());

Hits hits = new IndexSearcher(INDEX_STORE_PATH).search(query);

for (int i = 0;i hitsLength ; i++)

{

Document doc = hits.doc(i);

String title = doc.get(“title”);

String summary = doc.get(“summary”);

// 搜索出来的结果高亮显示在页面上

if (title != null) {

TokenStream tokenStream = analyzer.tokenStream(“title”,new StringReader(title));

String highlighterValue = highlighter.getBestFragment(tokenStream, title) ;

if(highlighterValue != null){

title = highlighterValue ;

}

//log.info("SearchHelper.search.title="+title);

}

if(summary!= null){

TokenStream tokenStream = analyzer.tokenStream(“summary”,new StringReader(summary));

String highlighterValue = highlighter.getBestFragment(tokenStream, creator) ;

if(highlighterValue != null){

summary = highlighterValue ;

}

//log.info("SearchHelper.search. summary ="+ summary);

}

2．结合平台构造搜索模块

PageData 类用来存放检索结果集数据。

PageInfo 类用来存放页面相关信息例如，PageData对象集合、总记录个数、每一页的记录数、总页面数量等等。

SearchHelper用来充当整个搜索模块的对外接口。

三．为平台组件添加索引的步骤（以知识中心为例）

1．在com.cscec.oa.searchengine.extend.module 目录下添加一个新的package

例如：com.cscec.oa.searchengine.extend.module.resourcestore

2．在新的目录下建立data package 并建立相应的数据类，并使这个数据类继承BeanData。

例如：

package com.cscec.oa.searchengine.extend.module.resourcestore.data

public class ResourceStoreBeanData extends BeanData{

}

3. 与data package 同一级目录建立manager package 并建立相应管理类，并使这个管理类继承BeanDataManager

例如：

com.cscec.oa.searchengine.extend.module.resourcestore.manager

public class ResourceStoreBeanDataManagerImpl extends BeanDataManager{

}

4．以管理员的身份登陆OA后，在菜单中找到“索引模块管理”链接，将相应信息添加完成后，便可以在List 页面点击“创建索引”对该模块的数据进行索引的建立，建立完成后便可以进行查询。

求基于JAVA设计的搜索引擎代码。

在业务逻辑层里操作不是都相同的么？为什么特别指出不需要JSP要用GUI呢？难道是用ajax写?但你说在数据库搜索内容并显示又不像ajax。搞不懂。

类似于下面那样子的业务吧？：

String sql="select WP_PRODUCT.*,WP_PROD_CTGRY.C_NAME from WP_PRODUCT,WP_PROD_CTGRY where WP_PRODUCT.CTGRY_ID=WP_PROD_CTGRY.TID ";

ListObject params=new ArrayListObject();

if(type!=null!"".equals(type)){

sql+=" and CTGRY_ID like ?";

params.add(type+"%");

}

if(proName!=null!"".equals(proName)){

sql+=" and NAME like ?";

params.add("%"+proName+"%");

}

if(code!=null!"".equals(code)){

sql+=" and CUSTOM_ID like ?";

params.add(code+"%");

}

if(brandId!=null!"".equals(brandId)){

sql+=" and OWNER_ID = ?";

params.add(brandId);

}

if(netId!=null !"".equals(netId)) {

sql += " and WP_PRODUCT.TID IN(SELECT PRODUCT_ID FROM WP_NET_PRODUCT WHERE OWNER_ID = ?) ";

params.add(netId);

}

sql += " order by WP_PRODUCT.MOD_DATE desc";

this.getVisitor().createPaginationExecutor(sql, page, params.toArray()).pagination(WpProdBean.class);

java搜索引擎源代码的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于开源的搜索引擎代码、java搜索引擎源代码的信息别忘了在本站进行查找喔。

标签：搜索引擎开源源代码代码 java

版权说明：如非注明，本站文章均为 AH站长原创，转载请注明出处和附带本文链接；

本文地址：http://ahzz.com.cn/post/1288.html；

上一篇：jq图片左右滑动效果代码（jquery左右滑动效果）
下一篇：html幻灯片代码（html5幻灯片）

java搜索引擎源代码（开源的搜索引擎代码）

本文目录一览：

跪求一个java的新闻搜索引擎的源代码

java如何实现搜索功能。比如，输入txt就能搜索出这个文件夹内所有txt格式的文件。请给完整代码。

怎么用java 开发一个搜索引擎呀？

求基于JAVA设计的搜索引擎代码。

相关推荐

取消回复欢迎你发表评论:

温馨提示

java搜索引擎源代码（开源的搜索引擎代码）

本文目录一览：

跪求一个java的新闻搜索引擎的源代码

java如何实现搜索功能。比如，输入txt就能搜索出这个文件夹内所有txt格式的文件。请给完整代码。

怎么用java 开发一个搜索引擎呀？

求基于JAVA设计的搜索引擎代码。

相关推荐

取消回复欢迎 你 发表评论:

分享到

温馨提示

取消回复欢迎你发表评论: