「java读取文本单词」java提取文本内容

博主:adminadmin 2022-12-15 00:00:07 68

今天给各位分享java读取文本单词的知识,其中也会对java提取文本内容进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

Java编写一个程序读取文本文档,提取其中英文单词,将大写字母改为小写,

package file.system.demo.exception;

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileWriter;

import java.io.IOException;

import java.util.ArrayList;

import java.util.Collections;

import java.util.List;

import java.util.Scanner;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class FileManpulation {

public  static ListString   getLowerCaseWords(File file) {

Scanner scanner = null;

Pattern pattern = Pattern.compile("[a-zA-Z]+");

String text = "";

ListString  words = new ArrayList();

try {

scanner = new Scanner(file);

} catch (FileNotFoundException e) {

e.printStackTrace();

}

if(scanner!=null){

while(scanner.hasNextLine()){

text+=scanner.nextLine();

}

scanner.close();

}

//System.out.println(text);

Matcher matcher = pattern.matcher(text);

while (matcher.find()){

words.add(matcher.group().toLowerCase());

}

return words;

}

/**

 * 

 * @param words

 * @param file 输入文件

 * void

 */

public static void WriteToFile(ListString words ,File file){

Collections.sort(words);//排序

FileWriter writer=null;

try {

writer = new FileWriter(file);

for (String word : words) {

writer.write(word+" ");

}

} catch (IOException e) {

e.printStackTrace();

}

finally {

if(writer!=null){

try {

writer.close();

} catch (IOException e) {

e.printStackTrace();

}

}

}

}

static class InnerTest{

public static void main(String[] args) {

File file = new File("D:\\test.txt");

ListString words=getLowerCaseWords(file);

WriteToFile(words,new File("D:\\in.txt"));

}

}

}

一篇英文的文章,怎么通过JAVA代码,提取里面所有的单词?

读取txt文件可以用逐行扫描方式,提取单词用正则表达式。

前提:出现的连续英文字符就是单词;除了英文字符外地所有字符都不是单词;每行的最后一个单词不能断字,即hel-(提行)lo。

// 读取文件就省略了哈

String s = "I have 5 apples... How much do you have?";

// 以出现1次或多次的非英文符号为单词的分隔

String[] a = s.split("[^a-zA-Z]+");

// 输出结果,总共有8个单词

System.out.println(a.length);

java 求助,读取一个txt中所有单词 和 不重复单词

因为您的words_all并没有初始化,在使用前请进行初始化

words_all = new String[100];//这里面的100,请示情况而定

看来一下您的代码,小小建议,换成List和Set比较好

ListString words = new ArrayListString();//存放全部单词

SetString uniqueWords = new HashSetString();//存放不重复的单词

Java中如何将字符串中含有两个字母组成的单词获取出来

如果s='123abc'取得s1='abc'

用正则,例如:s="123abc4a"printre.findall("[a-z]+",s)结果是:['abc','a']。

扩展资料

字符串主要用于编程,概念说明、函数解释、用法详述见正文,这里补充一点:字符串在存储上类似字符数组,所以它每一位的单个元素都是可以提取的,如s=“abcdefghij”,则s[1]=“b”,s[9]="j",这可以给我们提供很多方便,如高精度运算时每一位都可以转化为数字存入数组。

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为s=“a1a2···an”(n=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。

补充:字符串在存储上类似字符数组,它每一位单个元素都是能提取的,字符串的零位是它的长度,如s[0]=10,这提供给我们很多方便,例如高精度运算时每一位都能转化为数字存入数组。

通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是:长度相等,并且各个对应位置上的字符都相等。设p、q是两个串,求q在p中首次出现的位置的运算叫做模式匹配。串的两种最基本的存储方式是顺序存储方式和链接存储方式。

java读取文本单词的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于java提取文本内容、java读取文本单词的信息别忘了在本站进行查找喔。

The End

发布于:2022-12-15,除非注明,否则均为首码项目网原创文章,转载请注明出处。