「词性解析java」词性的辨析
本篇文章给大家谈谈词性解析java,以及词性的辨析对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
本文目录一览:
- 1、怎么用java语言实现从词性标注后的文本 中提出汉字,并在txt文本中逐行显示?
- 2、java如何替换句子分词后指定词性词语
- 3、Java编程 如何提取单词表中的词性
- 4、java中是否有区分词性的类库
- 5、java提取文本中特定内容
- 6、java用什么分词器去 标注英文单词的词性
怎么用java语言实现从词性标注后的文本 中提出汉字,并在txt文本中逐行显示?
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 提取汉字
*
* @author ajax_2003
* @version 1.0, 2009-7-23
*
*/
public class ExtractKanji {
public static void main(String[] args) {
String str = "第七/m 章/q 茶树/n 芽/n 叶/n 咀/n 食性/n 害虫/n 咀/n 食/n 茶树/n 芽/n 叶/n 的/u 害虫/n ,"
+ "/w 主要/d 是/v 蛾/n 类/q 幼虫/n ,/w 包括/v 尺蠖/n 、/w 毒蛾/n 、/w 卷/q 类/n 、/w 蓑/n 蛾/n 、"
+ "/w 刺/v 蛾/n 、/w 夜蛾/n 等/u 类/n 及/c 茶/n 蚕/n 、/w 茶叶/n 斑/n 蛾/n 等/u 。"
+ "/w 另/r 一/m 类/q 是/v 象甲/n 、/w 叶/n 甲等/b 甲虫/n ,"
+ "/w 直接/a 蚕食/v 芽/n 梢/n 及/c 成/v 老叶/n 第一/m 节/q 尺蠖蛾/n 类/q 害虫/n 危害/v 茶树/n 的/u "
+ "尺蠖/n 多达/v 40/m 余/m 种/q ,/w 同/p 属/v 鳞翅目/n 尺蠖蛾/n 科/n 。";
String result = getKanji(str);
System.out.println(result);
}
private static String getKanji(String str) {
Pattern pattern = Pattern.compile("[^/\\w]+");
Matcher matcher = pattern.matcher(str);
StringBuilder sb = new StringBuilder();
while (matcher.find()) {
sb.append(matcher.group());
}
return sb.toString();
}
}
java如何替换句子分词后指定词性词语
String a = "我/rr 生活/vi 在/p 北京/ns ";
String x = a.replace("北京","河南");
String中有替换字符串的函数,替换之后将返回一个新的字符串
要是List的话(我用ArrayList做例子)
就你的例子而言
String[] str = new String[3];
for(i = 0;i list.size();i++)
str[i] = a.replace("北京",list.get(i));
这样就行了
Java编程 如何提取单词表中的词性
设计一个数据结构,读取文本数据,保存好。
通过不同输入参数判断不同属性。
java中是否有区分词性的类库
这个取决于你要做什么
一个词,可以有很多种词性,具体词性是根据在句子中的位置决定的。
你到底是要字典,可以查词性,还是需要语法解析器,来分析在句子中的词性
java提取文本中特定内容
读取文件内容我就不写了一行一行处理
//这个str就是你给的标记文本:
String str = "This/DT talk/NN describes/VBZ the/DT optimal/JJ -LRB-/-LRB- " +
"revenue/NN maximizing/VBG -RRB-/-RRB- auction/NN for/IN sponsored/VBN" +
" search/NN advertising/NN ./. We/PRP show/VBP that/IN a/DT search/NN " +
"engine/NN 's/POS optimal/JJ reserve/NN price/NN is/VBZ independent/JJ " +
"of/IN the/DT number/NN of/IN bidders/NNS ./. Using/VBG simulations/NNS , " +
"we/PRP consider/VBP the/DT changes/NNS that/WDT result/VBP from/IN a/DT " +
"search/NN engine/NN 's/POS choice/NN ";
//通过匹配得到String数组
//匹配时被匹配的字符会被自动去除掉(这个就去看看java api String类的方 法"split(regx)")
String strs[] = str.split("/NN|/JJ");
for (int i = 0; i strs.length; i++) {
//处理数组
String str2 = strs[i].substring(strs[i].lastIndexOf(" "),strs[i].length());
System.out.println(str2);
}
java用什么分词器去 标注英文单词的词性
可以试试stanford Tagger, 百度搜索下stanford Tagger。
中文词性标注可以用hanlp.
词性解析java的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于词性的辨析、词性解析java的信息别忘了在本站进行查找喔。
发布于:2022-12-24,除非注明,否则均为
原创文章,转载请注明出处。