Lucene 性能

2022-01-15 00:00:00 performance lucene java

能否请您就 lucene 性能应遵循的步骤提出建议.尤其是大数据(大约 1TB 的 pdf 文件要被索引)

could you please suggest on the steps to be followed for lucene performance. especially with large data (around 1TB of pdf files to be indexed)

推荐答案

  1. 阅读 扩展 Lucene 和 Solr.
  2. 从 Lucene 定义您的需求(例如:您正在为 PDF 编制索引 - 您需要存储全文,只是为了使其可搜索,还是根本不需要?)
  3. 做一个小规模的实验——索引几个文档,看看检索是否足够好.
  4. 尝试对整个内容进行索引(考虑论文中关于快速索引和索引以提高检索速度的提示)- 检索是否足够好?性能够好吗?
  5. 迭代.

相关文章