「java读取文本单词」java提取文本内容
今天给各位分享java读取文本单词的知识,其中也会对java提取文本内容进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
- 1、Java编写一个程序读取文本文档,提取其中英文单词,将大写字母改为小写,
- 2、一篇英文的文章,怎么通过JAVA代码,提取里面所有的单词?
- 3、java 求助,读取一个txt中所有单词 和 不重复单词
- 4、Java中如何将字符串中含有两个字母组成的单词获取出来
Java编写一个程序读取文本文档,提取其中英文单词,将大写字母改为小写,
package file.system.demo.exception;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
import java.util.Scanner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class FileManpulation {
public static ListString getLowerCaseWords(File file) {
Scanner scanner = null;
Pattern pattern = Pattern.compile("[a-zA-Z]+");
String text = "";
ListString words = new ArrayList();
try {
scanner = new Scanner(file);
} catch (FileNotFoundException e) {
e.printStackTrace();
}
if(scanner!=null){
while(scanner.hasNextLine()){
text+=scanner.nextLine();
}
scanner.close();
}
//System.out.println(text);
Matcher matcher = pattern.matcher(text);
while (matcher.find()){
words.add(matcher.group().toLowerCase());
}
return words;
}
/**
*
* @param words
* @param file 输入文件
* void
*/
public static void WriteToFile(ListString words ,File file){
Collections.sort(words);//排序
FileWriter writer=null;
try {
writer = new FileWriter(file);
for (String word : words) {
writer.write(word+" ");
}
} catch (IOException e) {
e.printStackTrace();
}
finally {
if(writer!=null){
try {
writer.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
static class InnerTest{
public static void main(String[] args) {
File file = new File("D:\\test.txt");
ListString words=getLowerCaseWords(file);
WriteToFile(words,new File("D:\\in.txt"));
}
}
}
一篇英文的文章,怎么通过JAVA代码,提取里面所有的单词?
读取txt文件可以用逐行扫描方式,提取单词用正则表达式。
前提:出现的连续英文字符就是单词;除了英文字符外地所有字符都不是单词;每行的最后一个单词不能断字,即hel-(提行)lo。
// 读取文件就省略了哈
String s = "I have 5 apples... How much do you have?";
// 以出现1次或多次的非英文符号为单词的分隔
String[] a = s.split("[^a-zA-Z]+");
// 输出结果,总共有8个单词
System.out.println(a.length);
java 求助,读取一个txt中所有单词 和 不重复单词
因为您的words_all并没有初始化,在使用前请进行初始化
words_all = new String[100];//这里面的100,请示情况而定
看来一下您的代码,小小建议,换成List和Set比较好
ListString words = new ArrayListString();//存放全部单词
SetString uniqueWords = new HashSetString();//存放不重复的单词
Java中如何将字符串中含有两个字母组成的单词获取出来
如果s='123abc'取得s1='abc'
用正则,例如:s="123abc4a"printre.findall("[a-z]+",s)结果是:['abc','a']。
扩展资料
字符串主要用于编程,概念说明、函数解释、用法详述见正文,这里补充一点:字符串在存储上类似字符数组,所以它每一位的单个元素都是可以提取的,如s=“abcdefghij”,则s[1]=“b”,s[9]="j",这可以给我们提供很多方便,如高精度运算时每一位都可以转化为数字存入数组。
字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为s=“a1a2···an”(n=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。
补充:字符串在存储上类似字符数组,它每一位单个元素都是能提取的,字符串的零位是它的长度,如s[0]=10,这提供给我们很多方便,例如高精度运算时每一位都能转化为数字存入数组。
通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是:长度相等,并且各个对应位置上的字符都相等。设p、q是两个串,求q在p中首次出现的位置的运算叫做模式匹配。串的两种最基本的存储方式是顺序存储方式和链接存储方式。
java读取文本单词的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于java提取文本内容、java读取文本单词的信息别忘了在本站进行查找喔。
发布于:2022-12-15,除非注明,否则均为
原创文章,转载请注明出处。