「java文本pdf」java文本文档怎么运行

博主:adminadmin 2023-01-09 16:03:08 664

今天给各位分享java文本pdf的知识,其中也会对java文本文档怎么运行进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

《Java中文文本信息处理从海量到精准》pdf下载在线阅读全文,求百度网盘云资源

《Java中文文本信息处理从海量到精准》百度网盘pdf最新全集下载:

链接:

?pwd=pzxa 提取码: pzxa

简介:Java中文文本信息处理从海量到精准以让零基础的读者通过自学完成一个中文分词系统为目标,从Java基础语法开始讲解,然后介绍文本处理相关的数据结构和算法,最后介绍如何实现文本切分和词性标注。本书是介绍业界热门的以Java开发中文分词技术的专享书籍。  

怎么用java代码生成pdf文档

import java.io.File;  

import java.io.FileOutputStream;  

import java.io.IOException;  

 

import com.itextpdf.text.*;  

import com.itextpdf.text.pdf.PdfWriter;  

 

public class PdfTest  

{  

    public static void main(String[] args) throws Exception  

    {  

        Document pdfDoc = new Document();  

        // 将要生成的 pdf 文件的路径输出流  

        FileOutputStream pdfFile =   

            new FileOutputStream(new File("F:/study/test/firstPdf.pdf"));  

 

        // pdf 文件中的一个文字段落  

        Paragraph paragraph = new Paragraph("My first PDF file with an image ...");  

        Image image = Image.getInstance("F:/study/test/洛克 李.jpg");  

          

        // 用 Document 对象、File 对象获得 PdfWriter 输出流对象  

        PdfWriter.getInstance(pdfDoc, pdfFile);  

        pdfDoc.open();  // 打开 Document 文档  

          

        // 添加一个文字段落、一张图片  

        pdfDoc.add(paragraph);  

        pdfDoc.add(image);  

      

        pdfDoc.close();  

    }  

}

Java如何使用Java向PDF页面中添加文本

①建立com.lowagie.text.Document对象的实例。

Document document = new Document();

②建立一个书写器(Writer)与document对象关联,通过书写器(Writer)可以将文档写入到磁盘中。

PDFWriter.getInstance(document, new FileOutputStream("Helloworld.PDF"));

③打开文档。

document.open();

④向文档中添加内容。

document.add(new Paragraph("Hello World"));

⑤关闭文档。

document.close();

通过上面的5个步骤,就能产生一个Helloworld.PDF的文件,文件内容为"Hello World"。

java 如何读取PDF文件内容

import java.io.File;

import java.io.FileOutputStream;

import java.io.OutputStreamWriter;

import java.io.Writer;

import java.net.MalformedURLException;

import java.net.URL;

import org.pdfbox.pdmodel.PDDocument;

import org.pdfbox.util.PDFTextStripper;

public class PdfReader {

public void readFdf(String file) throws Exception {

// 是否排序

boolean sort = false;

// pdf文件名

String pdfFile = file;

// 输入文本文件名称

String textFile = null;

// 编码方式

String encoding = "UTF-8";

// 开始提取页数

int startPage = 1;

// 结束提取页数

int endPage = Integer.MAX_VALUE;

// 文件输入流,生成文本文件

Writer output = null;

// 内存中存储的PDF Document

PDDocument document = null;

try {

try {

// 首先当作一个URL来装载文件,如果得到异常再从本地文件系统//去装载文件

URL url = new URL(pdfFile);

//注意参数已不是以前版本中的URL.而是File。

document = PDDocument.load(pdfFile);

// 获取PDF的文件名

String fileName = url.getFile();

// 以原来PDF的名称来命名新产生的txt文件

if (fileName.length() 4) {

File outputFile = new File(fileName.substring(0, fileName

.length() - 4)

+ ".txt");

textFile = outputFile.getName();

}

} catch (MalformedURLException e) {

// 如果作为URL装载得到异常则从文件系统装载

//注意参数已不是以前版本中的URL.而是File。

document = PDDocument.load(pdfFile);

if (pdfFile.length() 4) {

textFile = pdfFile.substring(0, pdfFile.length() - 4)

+ ".txt";

}

}

// 文件输入流,写入文件倒textFile

output = new OutputStreamWriter(new FileOutputStream(textFile),

encoding);

// PDFTextStripper来提取文本

PDFTextStripper stripper = null;

stripper = new PDFTextStripper();

// 设置是否排序

stripper.setSortByPosition(sort);

// 设置起始页

stripper.setStartPage(startPage);

// 设置结束页

stripper.setEndPage(endPage);

// 调用PDFTextStripper的writeText提取并输出文本

stripper.writeText(document, output);

} finally {

if (output != null) {

// 关闭输出流

output.close();

}

if (document != null) {

// 关闭PDF Document

document.close();

}

}

}

/**

* @param args

*/

public static void main(String[] args) {

// TODO Auto-generated method stub

PdfReader pdfReader = new PdfReader();

try {

// 取得E盘下的SpringGuide.pdf的内容

pdfReader.readFdf("E://SpringGuide.pdf");

} catch (Exception e) {

e.printStackTrace();

}

}

}

java文本pdf的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于java文本文档怎么运行、java文本pdf的信息别忘了在本站进行查找喔。