「词性标注java」词性标注英语
本篇文章给大家谈谈词性标注java,以及词性标注英语对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
本文目录一览:
怎么用java语言实现从词性标注后的文本 中提出汉字,并在txt文本中逐行显示?
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 提取汉字
*
* @author ajax_2003
* @version 1.0, 2009-7-23
*
*/
public class ExtractKanji {
public static void main(String[] args) {
String str = "第七/m 章/q 茶树/n 芽/n 叶/n 咀/n 食性/n 害虫/n 咀/n 食/n 茶树/n 芽/n 叶/n 的/u 害虫/n ,"
+ "/w 主要/d 是/v 蛾/n 类/q 幼虫/n ,/w 包括/v 尺蠖/n 、/w 毒蛾/n 、/w 卷/q 类/n 、/w 蓑/n 蛾/n 、"
+ "/w 刺/v 蛾/n 、/w 夜蛾/n 等/u 类/n 及/c 茶/n 蚕/n 、/w 茶叶/n 斑/n 蛾/n 等/u 。"
+ "/w 另/r 一/m 类/q 是/v 象甲/n 、/w 叶/n 甲等/b 甲虫/n ,"
+ "/w 直接/a 蚕食/v 芽/n 梢/n 及/c 成/v 老叶/n 第一/m 节/q 尺蠖蛾/n 类/q 害虫/n 危害/v 茶树/n 的/u "
+ "尺蠖/n 多达/v 40/m 余/m 种/q ,/w 同/p 属/v 鳞翅目/n 尺蠖蛾/n 科/n 。";
String result = getKanji(str);
System.out.println(result);
}
private static String getKanji(String str) {
Pattern pattern = Pattern.compile("[^/\\w]+");
Matcher matcher = pattern.matcher(str);
StringBuilder sb = new StringBuilder();
while (matcher.find()) {
sb.append(matcher.group());
}
return sb.toString();
}
}
java用什么分词器去 标注英文单词的词性
可以试试stanford Tagger, 百度搜索下stanford Tagger。
中文词性标注可以用hanlp.
java怎样调用新浪云里的分词接口
官网说明:,SAE分词系统基于隐马模型开发出的汉语分析系统,主要功能包括中文分词、词性标注、命名实体识别、新词识别。
调用规则:;wd={语句}
(返回结果里包含分词词性,随便用个程序语言处理一下就行了,详见:)
只需要改变URL中的{语句}参数即可(编码为utf-8),因为是get方式传参,语句不能太长;也可以根据官方的api文档,做个简易的post方式。
关于词性标注java和词性标注英语的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。
发布于:2022-12-01,除非注明,否则均为
原创文章,转载请注明出处。