java中pdfbox的简单介绍

博主:adminadmin 2023-03-17 08:58:09 259

今天给各位分享java中pdfbox的知识,其中也会对进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

java pdfbox 有哪些方法及其作用

按照抽象来理解,方法是实现具体的功能的。

方法:方法名()

属性:属性名

例如:数组中的属性是:length

String中的方法是:length();

pdfbox itext哪个好用

PDFBox和IText是解析PDF文档最常用的两种java API。

1、 使用PDFBox时,需要添加:pdfbox-2.0.0.jar、fontbox-2.0.0.jar、commons-logging-1.2.jar;

2、 使用iText时,需要添加:itextpdf-5.5.9.jar;

话不多说,直接看具体代码。

import java.io.File;

import java.io.FileNotFoundException;

import java.io.IOException;

import org.apache.pdfbox.pdmodel.PDDocument;

import org.apache.pdfbox.text.PDFTextStripper;

import com.itextpdf.text.pdf.PdfReader;

import com.itextpdf.text.pdf.parser.PdfReaderContentParser;

import com.itextpdf.text.pdf.parser.SimpleTextExtractionStrategy;

import com.itextpdf.text.pdf.parser.TextExtractionStrategy;

public class PdfPaser {

/**

* 使用IText API解析

* @param filePath 待解析pdf文档路径

* @return 解析得到的pdf文本字符串

* @throws Exception

*/

public String paserPDFFileByIText(String filePath) throws Exception {

TextExtractionStrategy strategy = null;

PdfReader reader = new PdfReader(filePath);

PdfReaderContentParser parser = new PdfReaderContentParser(reader);

StringBuffer buffer = new StringBuffer();

for (int i = 1; i = reader.getNumberOfPages(); i++) {

strategy = parser.processContent(i, new SimpleTextExtractionStrategy());

buffer.append(strategy.getResultantText());

}

return buffer.toString();

}

/**

* 使用PdfBox API解析

* @param filePath 待解析pdf文档路径

* @return 解析得到的pdf文本字符串

* @throws Exception

*/

public String paserPDFFileByPdfBox(String filePath) throws Exception {

File file = new File(filePath);

PDDocument document = PDDocument.load(file);

PDFTextStripper stripper = new PDFTextStripper();

String result = stripper.getText(document);

if(document != null){

document.close();

}

return result;

}

}

Java PDFBox 能在PDF上添加标签吗?

应该是能加东西的,PDFBox 提供了下面的功能:

(1)文本的提取

即在PDF文件里面把文本内容提取出来。

(2) 合并和拆分PDF文档

可以把几个PDF合并成一个PDF文件,也可以把一个PDF文件拆分成多个PDF文件。

(3) 表单填充

从PDF文件的表单中提取数据或者写入数据到PDF表单中。

(4) PDF/A的校验

根据PDF/A ISO 标准校验PDF文档

(5)打印PDF

通过Java的API去打印PDF文件

(6) 把PDF转换成图片

把PDF文件转换成图片

(7) 创建PDF文件

(8) PDF签名

Java如何使用Java创建一个空的PDF文档

package com.yiibai;import java.io.IOException;import org.apache.pdfbox.pdmodel.PDDocument;import org.apache.pdfbox.pdmodel.PDPage;// 需要下 apache pdfbox包和apache.commons.loggin乌,下载地址: 和 在本示例中下载使用的是:pdfbox-2.0.7.jar // 将下载的pdfbox-2.0.7.jar添加到Eclipse项目依懒库中。// 右键点击:"java_apache_pdf_box"-"Bulid Path"-"Add External Artchives...",然后选笃下载的"pdfbox-2.0.7.jar"和"commons-logging-1.2.jar"文件 public class CreatingEmptyPdf {

public static void main(String args[]) throws IOException {

// Creating PDF document object

PDDocument document = new PDDocument();

// Add an empty page to it

document.addPage(new PDPage());

// Saving the document

document.save("F:/worksp/javaexamples/java_apache_pdf_box/BlankPdf.pdf");

System.out.println("PDF created");

// Closing the document

document.close();

}}

java解析pdf文字顺序不对

修复你的PDF软件或者调整页面顺序。

java解析pdf获取pdf中内容信息:

第一种 使用开源组织提供的开源框架 pdfboxapi ;

特点:免费,功能强大,解析中文或许会存在乱码,默认格式有点乱,没有国产解析的那么美化。

想要按行读取:可以按照指定的模板,对pdf进行修改添加删除等操作,总之操作很骚,很强大。

1.pdfbox 需要带入依赖。

2.代码。

第二种使用国产的框架 Spire.PDF包含两种版本。

1 免费版。

友情提示: 免费版有 10 页的页数输出限制,在输出结果文档时只能输出前10页。将 PDF 文档转换为图片、Word、HTML、XPS等格式时,仅支持转换前 10 页。如超出限制,可升级到商业版,我们仅对免费版进行不定期维护。

2 商业版本。

api。

特点:商业版本收费,免费版本有限制,可供开发人员调试,解析格式友好,解析结果是按照行显示,对pdf 图形 ,水印 ,文本, 条形码等添加增删改操作,总之个人感觉比pdfbox顺手,但就是收费啊,谁让咱公司没钱呢。

主要功能:

只需 Free Spire.PDF for Java,无需 Adobe Acrobat。

Free Spire.PDF for Java 是一款完全独立的 PDF 类库。它的运行环境无需安装 Adobe Acrobat 或其他任何第三方组件。

多样化的PDF文档操作功能。

Free Spire.PDF for Java 支持画文本、图片、表格、条形码、形状到 PDF,提取文本和图片,创建、填充和删除 PDF 表单,添加文本/图片水印到 PDF,添加、更新和删除 PDF 书签,操作超链接、附件和注释,以及添加图片/文本印章到 PDF 等。

文档信息设置。

Free Spire.PDF for Java 支持设置 PDF 文档信息,例如文档属性设置,偏好设置(页面方向,页面大小,缩放比例等)。

高质量的文档转换功能。

Free Spire.PDF for Java 支持将 PDF 文档高质量地转换为 Word、HTML、XPS、图片、SVG 和 PDF/A 格式,以及将 XPS 文档高质量地转换为 PDF 格式。

文档安全性设置。

Free Spire.PDF for Java 支持给 PDF 文档添加和验证数字签名,加密和解密 PDF 文档,修改 PDF 文档的安全权限,以及检测签名后的 PDF 文档是否被修改。

易于集成。

开发人员可以轻易地将 Free Spire.PDF for Java 集成到 Java(J2SE和J2EE)应用程序中。

关于java中pdfbox和的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。