「java取中汉子字母」java取汉字首字母

admin 2022-12-12 17:24:06 982

本篇文章给大家谈谈java取中汉子字母，以及java取汉字首字母对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。

本文目录一览：

1、如何用java获取中文拼音的首字母
2、如何用JAVA获取中文拼音的首字母
3、java获得汉字的大写字母，其他字符不变
4、java中根据一段字符串，获取其中的字母，有要求；求个具体代码
5、java语言中如何获取字符串中汉字的个数

如何用java获取中文拼音的首字母

import java.io.UnsupportedEncodingException;

/**

* 取得给定汉字串的首字母串,即声母串

* Title: ChineseCharToEn

* @date 2004-02-19 注：只支持GB2312字符集中的汉字

public final class ChineseCharToEn {

private final static int[] li_SecPosValue = { 1601, 1637, 1833, 2078, 2274,

2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858,

4027, 4086, 4390, 4558, 4684, 4925, 5249, 5590 };

private final static String[] lc_FirstLetter = { "a", "b", "c", "d", "e",

"f", "g", "h", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s",

"t", "w", "x", "y", "z" };

/**

* 取得给定汉字串的首字母串,即声母串

* @param str 给定汉字串

* @return 声母串

public String getAllFirstLetter(String str) {

if (str == null || str.trim().length() == 0) {

return "";

}

String _str = "";

for (int i = 0; i str.length(); i++) {

_str = _str + this.getFirstLetter(str.substring(i, i + 1));

}

return _str;

}

/**

* 取得给定汉字的首字母,即声母

* @param chinese 给定的汉字

* @return 给定汉字的声母

public String getFirstLetter(String chinese) {

if (chinese == null || chinese.trim().length() == 0) {

return "";

}

chinese = this.conversionStr(chinese, "GB2312", "ISO8859-1");

if (chinese.length() 1) // 判断是不是汉字

{

int li_SectorCode = (int) chinese.charAt(0); // 汉字区码

int li_PositionCode = (int) chinese.charAt(1); // 汉字位码

li_SectorCode = li_SectorCode - 160;

li_PositionCode = li_PositionCode - 160;

int li_SecPosCode = li_SectorCode * 100 + li_PositionCode; // 汉字区位码

if (li_SecPosCode 1600 li_SecPosCode 5590) {

for (int i = 0; i 23; i++) {

if (li_SecPosCode = li_SecPosValue[i]

li_SecPosCode li_SecPosValue[i + 1]) {

chinese = lc_FirstLetter[i];

break;

}

} else // 非汉字字符,如图形符号或ASCII码

{

chinese = this.conversionStr(chinese, "ISO8859-1", "GB2312");

chinese = chinese.substring(0, 1);

}

return chinese;

}

/**

* 字符串编码转换

* @param str 要转换编码的字符串

* @param charsetName 原来的编码

* @param toCharsetName 转换后的编码

* @return 经过编码转换后的字符串

private String conversionStr(String str, String charsetName,String toCharsetName) {

try {

str = new String(str.getBytes(charsetName), toCharsetName);

} catch (UnsupportedEncodingException ex) {

System.out.println("字符串编码转换异常：" + ex.getMessage());

}

return str;

}

public static void main(String[] args) {

ChineseCharToEn cte = new ChineseCharToEn();

System.out.println("获取拼音首字母："+ cte.getAllFirstLetter("北京联席办"));

}

如何用JAVA获取中文拼音的首字母

package test;

public class FirstLetterUtil {

private static int BEGIN = 45217;

private static int END = 63486; // 按照声母表示，这个表是在GB2312中的出现的第一个汉字，也就是说“啊”是代表首字母a的第一个汉字。 // i, u, v都不做声母, 自定规则跟随前面的字母

private static char[] chartable = {'啊', '芭', '擦', '搭', '蛾', '发', '噶', '哈', '哈', '击', '喀', '垃', '妈', '拿', '哦', '啪', '期', '然', '撒', '塌', '塌', '塌', '挖', '昔', '压', '匝',};

// 二十六个字母区间对应二十七个端点

// GB2312码汉字区间十进制表示

private static int[] table = new int[27];

// 对应首字母区间表

private static char[] initialtable = {'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 't', 't', 'w', 'x', 'y', 'z',};

// 初始化

static {

for (int i = 0; i 26; i++) {

table[i] = gbValue(chartable[i]);// 得到GB2312码的首字母区间端点表，十进制。

}

table[26] = END;// 区间表结尾

}

public static void main(String[] args) {

System.out.println( FirstLetterUtil.getFirstLetter("你好") ); ;

}

/**

* 根据一个包含汉字的字符串返回一个汉字拼音首字母的字符串最重要的一个方法，思路如下：一个个字符读入、判断、输出

public static String getFirstLetter(String sourceStr) {

String result = "";

String str = sourceStr.toLowerCase();

int StrLength = str.length();

int i;

try {

for (i = 0; i StrLength; i++) {

result += Char2Initial(str.charAt(i));

}

} catch (Exception e) {

result = "";

}

return result;

}

/**

* 输入字符,得到他的声母,英文字母返回对应的大写字母,其他非简体汉字返回 '0'

private static char Char2Initial(char ch) {

// 对英文字母的处理：小写字母转换为大写，大写的直接返回

if (ch = 'a' ch = 'z') {

return ch;

}

if (ch = 'A' ch = 'Z') {

return ch;

} // 对非英文字母的处理：转化为首字母，然后判断是否在码表范围内，

// 若不是，则直接返回。

// 若是，则在码表内的进行判断。

int gb = gbValue(ch);// 汉字转换首字母

if ((gb BEGIN) || (gb END))// 在码表区间之前，直接返回

{

return ch;

}

int i;

for (i = 0; i 26; i++) {// 判断匹配码表区间，匹配到就break,判断区间形如“[,)”

if ((gb = table[i]) (gb table[i + 1])) {

break;

}

if (gb == END) {//补上GB2312区间最右端

i = 25;

}

return initialtable[i]; // 在码表区间中，返回首字母

}

/**

* 取出汉字的编码 cn 汉字

private static int gbValue(char ch) {// 将一个汉字（GB2312）转换为十进制表示。

String str = new String();

str += ch;

try {

byte[] bytes = str.getBytes("GB2312");

if (bytes.length 2) {

return 0;

}

return (bytes[0] 8 0xff00) + (bytes[1] 0xff);

} catch (Exception e) {

return 0;

}

java获得汉字的大写字母，其他字符不变

看看是不是你要的效果！

/**

* 根据汉字提取该汉字的首字母

* @author Administrator

public class StringUtil {

// 国标码和区位码转换常量

static final int GB_SP_DIFF = 160;

// 存放国标一级汉字不同读音的起始区位码

static final int[] secPosValueList = { 1601, 1637, 1833, 2078, 2274, 2302,

2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858, 4027,

4086, 4390, 4558, 4684, 4925, 5249, 5600 };

// 存放国标一级汉字不同读音的起始区位码对应读音

static final char[] firstLetter = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H',

'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'W', 'X',

'Y', 'Z' };

// 获取一个字符串的拼音码

public static String getFirstLetter(String oriStr) {

String str = oriStr.toLowerCase();

StringBuffer buffer = new StringBuffer();

char ch;

char[] temp;

for (int i = 0; i str.length(); i++) { // 依次处理str中每个字符

ch = str.charAt(i);

temp = new char[] {ch};

byte[] uniCode = new String(temp).getBytes();

if (uniCode[0] 128 uniCode[0] 0) { // 非汉字

buffer.append(temp);

} else {

buffer.append(convert(uniCode));

}

return buffer.toString();

}

/**

* 获取一个汉字的拼音首字母。 GB码两个字节分别减去160，转换成10进制码组合就可以得到区位码

* 例如汉字“你”的GB码是0xC4/0xE3，分别减去0xA0（160）就是0x24/0x43

* 0x24转成10进制就是36，0x43是67，那么它的区位码就是3667，在对照表中读音为‘n’

static char convert(byte[] bytes) {

char result = '-';

int secPosValue = 0;

int i;

for (i = 0; i bytes.length; i++) {

bytes[i] -= GB_SP_DIFF;

}

secPosValue = bytes[0] * 100 + bytes[1];

for (i = 0; i 23; i++) {

if (secPosValue = secPosValueList[i]

secPosValue secPosValueList[i + 1]) {

result = firstLetter[i];

break;

}

return result;

}

public static void main(String[] args) {

System.out.println(":"+StringUtil.getFirstLetter("哈哈123#$bc成功!!!!"));

}

有什么疑问可以百度HI我，加点分哦！

java中根据一段字符串，获取其中的字母，有要求；求个具体代码

要求1中要去掉所有数字，要求2、3中又要保留数字并进行翻译，所以我两种都写了。具体代码为：

public class Test {

public static void main(String args[]) {

String str = "0as2sw$#3Six";

System.out.println("原字符串：[" + str + "]");

System.out.println("");

//不翻译数字

SetString set1 = new LinkedHashSet();

for (String s : str.split("[^A-Z a-z]")) {

if (s.length() 0) {

set1.add(s);

}

System.out.println("不翻译数字的结果：" + set1);

System.out.println("");

/*因为又要去除非字母和数字（以下简称去杂），又要将去杂结果分离成数字和字母，再翻译数字，整个流程挺麻烦的，索性在去杂之前，先将数字翻译成英文，为了使数字翻译后的英文和原字符串的字母分开，在数字左右添加占位符#，这样的话，形如：[a1b2c3]就会被处理为：[a#one#b#two#c#three#]，这样去杂后，就会被分割为：[a,one,b,two,c,three]了。这里定义了枚举值English，用于实现0-9的英文映射，[10]不好映射成[ten]，现在只能映射为[one,zero]，如果按照题干非要映射为ten的话你再考虑考虑吧*/

for (English english : English.values()) {

str = str.replaceAll(english.getNum() + "", "#" + english.name() + "#");

}

System.out.println("将数字替换为“占位符 + 英文 + 占位符”的中间结果：[" + str + "]");

System.out.println("");

//翻译数字的结果

SetString set2 = new LinkedHashSet();

for (String s : str.split("[^A-Za-z]")) {

if (s.length() 0 ) {

//判断当前字符串是否是数字的英文，如果不是，就把它拆成单字母

if (mappingEnglish(s)){

set2.add(s);

}else {

for (char c : s.toCharArray()) {

set2.add(String.valueOf(c));

}

System.out.println("翻译数字的结果：" + set2);

}

//判断当前字符串是否是数字的英文

private static boolean mappingEnglish(String str) {

for (English english : English.values()) {

str = str.toLowerCase();

if (english.name().equals(str)) {

return true;

}

return false;

}

enum English {

zero(0),

one(1),

two(2),

three(3),

four(4),

five(5),

six(6),

seven(7),

eight(8),

nine(9);

private int num;

public int getNum() {

return num;

}

English(int num) {

this.num = num;

}

我怕发出来代码又挤在一起，顺便也截个图：

8-21行

22-50行

51-61行

62-85行完

运行结果：

java语言中如何获取字符串中汉字的个数

【实例描述】

字符串中可以包含数字，字母、汉字或者其他字符。使用Character类的isDigit()方法可以判断字符中的某个字符是否为数字，使用Character类的isLetter()方法可以判断字符中的某个字符是否为字母。实例中将介绍一种方法用来判断字符串中的某个字符是否为汉字，通过此方法可以计算字符串中汉字的数量。实例的运行效果如图4.24所示。

【实现过程】

在Eclipse中新建项目ChineseCharacter，并在其中创建一个ChineseCharacter.java文件。在该类的主方法中创建标准输入流的扫描器对象，接收用户输入的字符串。我们在程序中使用matches()方法来统计该字符串中汉字的个数。核心代码如下所示：

protectedvoiddo_button_actionPerformed(ActionEvente){Stringtext=chineseArea.getText();//获取用户输入intamount=0;//创建汉字数量计数器for(inti=0;itext.length();i++){//遍历字符串每一个字符//使用正则表达式判断字符是否属于汉字编码booleanmatches=Pattern.matches("^[\u4E00-\u9FA5]{0,}$",""+text.charAt(i));if(matches){//如果是汉字amount++;//累加计数器}}umField.setText(amount+"");//在文本框显示汉字数量}

【代码解析】

本实例的关键点在于正则表达式的使用。Java提供了Pattern用于正则表达式的编译表示形式，该类提供的静态方法matches()可以执行正则表达式的匹配。该方法编译给定正则表达式并尝试给定输入与其匹配。如果要匹配的字符序列与正则表达式匹配则返回true，否则返回false。其声明语法如下：

publicstaticbooleanmatches(Stringregex,CharSequenceinput);【知识扩展】

使用正则表达式可以方便地进行字符串操作，正则表达式经常被用来验证用户输入的信息，如可以判断用户输入的格式是否正确。本实例中使用正则表达式来判断用户输入的字符串是否为汉字，如果为汉字则计数器加1，最后得到字符串中所有汉字的数量。

java取中汉子字母的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于java取汉字首字母、java取中汉子字母的信息别忘了在本站进行查找喔。

标签：java取中汉子字母