加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程 > 正文

搜索 – 像关系数据库一样使用Lucene

发布时间:2021-04-03 13:12:56 所属栏目:编程 来源:网络整理
导读:我只是想知道我们是否可以在lucene中实现一些RDBMS功能. 例: 1)我有10,000个项目文档(pdf文件),必须将其内容编入索引以使其可供搜索. 2)每份文件都与单一项目有关.项目可以包含项目名称,编号,开始日期,结束日期,位置,类型等详细信息. 我必须在pdf文件的内容

我只是想知道我们是否可以在lucene中实现一些RDBMS功能.

例:
1)我有10,000个项目文档(pdf文件),必须将其内容编入索引以使其可供搜索.
2)每份文件都与单一项目有关.项目可以包含项目名称,编号,开始日期,结束日期,位置,类型等详细信息.

我必须在pdf文件的内容中搜索给定的关键字,但在显示结果时,我想显示项目元数据,如第(2)点所述.

我的想法是在索引时将名为projectId的字段与每个pdf文件相关联.一旦我们得到了,我们将再次触发搜索以获取项目元数据.

这样我们就可以避免重复数据.此外,如果我们想要更新项目元数据,我们最终只能在SINGLE PLACE更新.否则,如果我们使用所有pdf doument索引存储这个元数据,我们将最终更新所有文档,这不是我想要的方式.

请指教.

解决方法

如果我理解正确,你有两个问题:

>我可以在Lucene中存储项目ID并将其用于进一步搜索吗?是的你可以.这是一种常见的做法.>我可以使用此项目ID来搜索Lucene的项目元数据吗?是的你可以.我不知道这是不是一个好主意.这取决于元数据更新的频率和访问模式.如果元数据是相对静态的,并且您只能通过id访问它,Lucene可能是存储它的好地方.否则,您可以将项目ID用作数据库表的主键,这可能更适合.

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读