「java结巴分词」Java 分词

博主:adminadmin 2022-11-28 20:28:07 41

今天给各位分享java结巴分词的知识,其中也会对Java 分词进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

用结巴分词的Java版本出现空指针异常错误,不知道该怎么解决?为什么别人能运行出来呢?

如果确定是dbHelper非空,目测应该是dbHelper取不到SQLiteDatabase实例,导致db.query抛空。请断点调试检查下。

有问题欢迎提问,有需要帮助可远程,满意请采纳,THX。

java如何分词??

如果你的分词规则是在一个字符串的开头和结尾加上"_",然后两个字符一分的话,代码可以这样写:

import java.util.ArrayList;

import java.util.List;

public class Participle

{

private static final String HEAD_END_STR = "_";

private static final int PARTICIPLE_LENGTH = 2;

public static void main(String[] args)

{

String exampleWord = "计算机";

exampleWord = "_" + exampleWord + "_";

int length = exampleWord.length();

ListString result = new ArrayListString();

for (int i = 0; i length - 1; i++)

{

String str = exampleWord.substring(i, i + PARTICIPLE_LENGTH);

result.add(str);

}

System.out.println(result);

}

}

输出结果:_计, 计算, 算机, 机_

java语言中文分词程序怎么编写分词程序正

现可以提供两种思路:

1.String或是StringBuffer(建议用) 中的indexOf("中华")方法,查找给定的的字符串中是否有给定词表中的词。

2.借鉴编译原理中的状态装换的思想。

先编写一个状态机,用于测试给定字符串中的词是否满足词表中的内容。

写在最后:1)建议使用第一种方法,因为在java 内部实现的查找操作其实 和你想得思路是相同的,不过他的效率会高些。

2)如果个人的编程能力比较强或是不考虑效率只是想实现专有的分词算法。可以使用第二种方法。

3)以上的两种方法都可以使用多线程来提高程序的效率。

java jieba分词怎么用

网页链接这个网站

下载好,解压。

在Eclipse中新建一个java项目。

在该项目的src文件夹下新建如下2个包

将解压好的文件jieba-analysis-master\src\main\java\com\huaban\analysis\jieba目录下的这8个文件

放到刚才新建的com.huaban.analysis.jieba包里。

再将jieba-analysis-master\src\main\java\com\huaban\analysis\jieba\viterbi文件夹里的文件放到刚才新建的com.huaban.analysis.jieba.viterbi包里。

再将jieba-analysis-master\src\main\resources文件夹下的4个文件放到该项目的src里,与刚才新建的2个包并列。

至此使用环境已完成。

最终项目目录如下:(图中最后的4个文件是直接在src目录下的)

再来就是测试。

如图再建个包

建个有main方法的类

public static void main(String[] args) throws IOException{

        String text = "本教程由新数羊正念睡眠提供。"; 

        JiebaSegmenter segmenter = new JiebaSegmenter(); 

        System.out.println(segmenter.sentenceProcess(text));

    }

运行一下试试。

成功了,可喜可贺。

在线等,比较急!!!我用java版的结巴分词写了一段代码,怎样将它输出到指定的txt文件中?

String str = segmenter.sentenceProcess(s);

System.out.println(str);

BufferedWriter out = new BufferedWriter(new FileWriter("F:\\out.txt"));

out.append(str);

java结巴分词的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于Java 分词、java结巴分词的信息别忘了在本站进行查找喔。

The End

发布于:2022-11-28,除非注明,否则均为首码项目网原创文章,转载请注明出处。