建设协会网站,windows7优化大师下载,手机腾讯网,做医学网站Aspose.Words库
是一个商业Java库#xff0c;还封装了常用的word、pdf、防伪码、水印等诸多功能。Apache 库需要注意的前置问题
问题1#xff1a;Word的两个格式doc和docx#xff0c;POI并没有提供统一的处理类。分别用 HWPFDocument 处理doc文档#xff0c;用 XWPFTempl…Aspose.Words库
是一个商业Java库还封装了常用的word、pdf、防伪码、水印等诸多功能。Apache 库需要注意的前置问题
问题1Word的两个格式doc和docxPOI并没有提供统一的处理类。分别用 HWPFDocument 处理doc文档用 XWPFTemplate 处理docx文档。
HWPFDocument 处理doc文档
XWPFTemplate 处理docx文档
解决方法1将.doc文件转成.docx格式处理完后再转回来。
解决方法2(待验证)可以前置统一将.doc名字重命名成.docx如果严格要求格式处理完后再把名字改回去。
Excelxls和xlsx同理。Miscrosoft Office各类文件格式的读写
Apache POI库
Apache POI是一个开源的Java库用于操作Microsoft Office格式的文件。
它支持各种Office文档的读写功能包括Word文档、Excel电子表格、PowerPoint演示文稿、Outlook电子邮件等。
Apache POI提供了一组API使得Java开发者能够轻松地在Java应用程序中处理Office文件。Java 将 Word 文档转换为 PDF
使用PdfConverter工具类如下
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.converter.pdf.PdfConverter;
import org.apache.poi.xwpf.converter.pdf.PdfOptions;
public class Word2PdfByApachePOI {public start void main(String[] args) throws Exception {// 读取word目标文件XWPFDocument docx new XWPFDocument(new FileInputStream(xxxx/input.docx));//创建pdf选项PdfOptions options PdfOptions.create();// word转为pdfPdfConverter.getInstance().convert(docx, new FileOutputStream(output.pdf),options);}
}
PDF操作
Apache PDFBox库是一个开源的Java工具专门用于处理PDF文档。
它允许用户创建全新的PDF文件编辑现有的PDF文档以及从PDF文件中提取内容。功能创建、渲染、打印、合并、拆分、加密、解密、签名等多种操作PDF文件的功能包括一个命令行工具可以用于执行各种PDF处理任务。
支持文本提取和搜索以及将PDF转换为其他格式如图片和文本。Apache PDFBox具备以下主要功能从PDF文件中提取Unicode文本。将单个PDF文件拆分成多个文件或将多个PDF文件合并成一个。从PDF表单中提取数据或填写PDF表单。验证PDF文件是否符合PDF/A-1b标准。使用标准的Java打印API打印PDF文件。将PDF文件另存为图像格式如PNG或JPEG。从零开始创建PDF文件包括嵌入字体和图像。对PDF文件进行数字签名。