word换pdf并且自动生成目录

2022-06-22 00:00:00 word 目录 自动生成

目录

 

利用aspose-word for java和aspose-pdf for java完成word转pdf并且生成目录

1. jacob

2. aspose

2.1 利用aspose-word for java将word转为pdf

2.2 利用aspose-word for java提取word中的标题

2.3 利用aspose-pdf for java插入pdf书签

利用aspose-word for java和aspose-pdf for java完成word转pdf并且生成目录

最近开发的项目涉及到word转pdf,在做了调研之后,发现了几款比较不错的工具:

1. jacob

这个解决方案太依赖于windows的office了,所以自己也只是写了个demo,没有深入研究。

2. aspose

aspose比传统的poi操作word简单了不少,更重要的是支持了doc和docx两种格式

2.1 利用aspose-word for java将word转为pdf

以下代码轻轻松松就可以实现:

// wordPath为word的绝对路径
com.aspose.words.Document doc = new com.aspose.words.Document(wordPath);
// word转pdf,pdfPath为pdf要保存的绝对路径
doc.save(pdfPath, SaveFormat.PDF);

本来以为做完这个功能已经可以摸鱼了,结果下一个功能又来了。(产品问:为什么转换的pdf没有目录呢?)

在苦苦研究了差不多一个多月的时间,终于在公司大神的帮助下,今天彻底完成了这个功能。

2.2 利用aspose-word for java提取word中的标题

com.aspose.words.Document originDoc = new com.aspose.words.Document("D:\\test\\1.doc");
// 后面需要用这个对象去获取当前段落所在的页码
LayoutCollector layoutCollector = new LayoutCollector(originDoc);
// 需要获取所有的section,要不然部分word提取目录不完整
Section[] sections = originDoc.getSections().toArray();
// 获取所有的段落
List<Paragraph> paragraphs = new ArrayList<>();
for (Section s:
    sections) {
    paragraphs.addAll(Arrays.asList(s.getBody().getParagraphs().toArray()));
 }
// 获取标题的关键代码。标题对应的值为0-8,提取自己所需标题即可
p.getParagraphFormat().getOutlineLevel();
// 获取页码
layoutCollector.getEndPageIndex(p);
// 获取标题名称
p.getListLabel().getLabelString() + " " + p.getText();

以上只是部分代码,需要源码的可以私信我。

2.3 利用aspose-pdf for java插入pdf书签

Document pdfDoc = new Document(filePath);
OutlineCollection outlineCollection = pdfDoc.getOutlines();
for (HeadingNode node :
                list) {
    OutlineItemCollection outLineItem = new                 
    OutlineItemCollection(outlineCollection);
    outLineItem.setTitle(node.getHeaderName());
    outLineItem.setAction(new GoToAction(node.getHeaderPage()));
    addPdfBKRecursive(node, outlineCollection, outLineItem);
    outlineCollection.add(outLineItem);
}
pdfDoc.save();

所以,整个功能的实现逻辑应该是:word转为pdf,获取原word的目录大纲,根据word获取的目录大纲添加pdf书签。在获取word目录和添加pdf书签都用到了递归。需要源码的可以私信我。

最后附一张自己完成功能的战果图:

原word的目录

《word换pdf并且自动生成目录》

转换为pdf书签之后的效果

《word换pdf并且自动生成目录》

每一个功能在没有实现出来之前是那样不切实际,实现出来之后自身又成长不少,所以,不用急于去下结论。

    原文作者:Abzz
    原文地址: https://blog.csdn.net/smallSBoy/article/details/114314853
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。

相关文章