「java取中汉子字母」java取汉字首字母

博主:adminadmin 2022-12-12 17:24:06 66

本篇文章给大家谈谈java取中汉子字母,以及java取汉字首字母对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。

本文目录一览:

如何用java获取中文拼音的首字母

import java.io.UnsupportedEncodingException;

/**

* 取得给定汉字串的首字母串,即声母串

* Title: ChineseCharToEn

* @date 2004-02-19 注:只支持GB2312字符集中的汉字

*/

public final class ChineseCharToEn {

private final static int[] li_SecPosValue = { 1601, 1637, 1833, 2078, 2274,

2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858,

4027, 4086, 4390, 4558, 4684, 4925, 5249, 5590 };

private final static String[] lc_FirstLetter = { "a", "b", "c", "d", "e",

"f", "g", "h", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s",

"t", "w", "x", "y", "z" };

/**

* 取得给定汉字串的首字母串,即声母串

* @param str 给定汉字串

* @return 声母串

*/

public String getAllFirstLetter(String str) {

if (str == null || str.trim().length() == 0) {

return "";

}

String _str = "";

for (int i = 0; i str.length(); i++) {

_str = _str + this.getFirstLetter(str.substring(i, i + 1));

}

return _str;

}

/**

* 取得给定汉字的首字母,即声母

* @param chinese 给定的汉字

* @return 给定汉字的声母

*/

public String getFirstLetter(String chinese) {

if (chinese == null || chinese.trim().length() == 0) {

return "";

}

chinese = this.conversionStr(chinese, "GB2312", "ISO8859-1");

if (chinese.length() 1) // 判断是不是汉字

{

int li_SectorCode = (int) chinese.charAt(0); // 汉字区码

int li_PositionCode = (int) chinese.charAt(1); // 汉字位码

li_SectorCode = li_SectorCode - 160;

li_PositionCode = li_PositionCode - 160;

int li_SecPosCode = li_SectorCode * 100 + li_PositionCode; // 汉字区位码

if (li_SecPosCode 1600 li_SecPosCode 5590) {

for (int i = 0; i 23; i++) {

if (li_SecPosCode = li_SecPosValue[i]

li_SecPosCode li_SecPosValue[i + 1]) {

chinese = lc_FirstLetter[i];

break;

}

}

} else // 非汉字字符,如图形符号或ASCII码

{

chinese = this.conversionStr(chinese, "ISO8859-1", "GB2312");

chinese = chinese.substring(0, 1);

}

}

return chinese;

}

/**

* 字符串编码转换

* @param str 要转换编码的字符串

* @param charsetName 原来的编码

* @param toCharsetName 转换后的编码

* @return 经过编码转换后的字符串

*/

private String conversionStr(String str, String charsetName,String toCharsetName) {

try {

str = new String(str.getBytes(charsetName), toCharsetName);

} catch (UnsupportedEncodingException ex) {

System.out.println("字符串编码转换异常:" + ex.getMessage());

}

return str;

}

public static void main(String[] args) {

ChineseCharToEn cte = new ChineseCharToEn();

System.out.println("获取拼音首字母:"+ cte.getAllFirstLetter("北京联席办"));

}

}

如何用JAVA获取中文拼音的首字母

package test;

public class FirstLetterUtil {

    private static int BEGIN = 45217;

    private static int END = 63486;    // 按照声母表示,这个表是在GB2312中的出现的第一个汉字,也就是说“啊”是代表首字母a的第一个汉字。    // i, u, v都不做声母, 自定规则跟随前面的字母

    private static char[] chartable = {'啊', '芭', '擦', '搭', '蛾', '发', '噶', '哈', '哈', '击', '喀', '垃', '妈', '拿', '哦', '啪', '期', '然', '撒', '塌', '塌', '塌', '挖', '昔', '压', '匝',};

    // 二十六个字母区间对应二十七个端点

    // GB2312码汉字区间十进制表示

    private static int[] table = new int[27];

    // 对应首字母区间表

    private static char[] initialtable = {'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 't', 't', 'w', 'x', 'y', 'z',};

    // 初始化

    static {

        for (int i = 0; i  26; i++) {

            table[i] = gbValue(chartable[i]);// 得到GB2312码的首字母区间端点表,十进制。

        }

        table[26] = END;// 区间表结尾

    }

    public static void main(String[] args) {

        System.out.println( FirstLetterUtil.getFirstLetter("你好")     );  ;

    }

    /**

     * 根据一个包含汉字的字符串返回一个汉字拼音首字母的字符串 最重要的一个方法,思路如下:一个个字符读入、判断、输出

     */

    public static String getFirstLetter(String sourceStr) {

        String result = "";

        String str = sourceStr.toLowerCase();

        int StrLength = str.length();

        int i;

        try {

            for (i = 0; i  StrLength; i++) {

                result += Char2Initial(str.charAt(i));

            }

        } catch (Exception e) {

            result = "";

        }

        return result;

    }

    /**

     * 输入字符,得到他的声母,英文字母返回对应的大写字母,其他非简体汉字返回 '0'

     */

    private static char Char2Initial(char ch) {

        // 对英文字母的处理:小写字母转换为大写,大写的直接返回

        if (ch = 'a'  ch = 'z') {

            return ch;

        }

        if (ch = 'A'  ch = 'Z') {

            return ch;

        }        // 对非英文字母的处理:转化为首字母,然后判断是否在码表范围内,

        // 若不是,则直接返回。

        // 若是,则在码表内的进行判断。

        int gb = gbValue(ch);// 汉字转换首字母

        if ((gb  BEGIN) || (gb  END))// 在码表区间之前,直接返回

        {

            return ch;

        }

        int i;

        for (i = 0; i  26; i++) {// 判断匹配码表区间,匹配到就break,判断区间形如“[,)”

            if ((gb = table[i])  (gb  table[i + 1])) {

                break;

            }

        }

        if (gb == END) {//补上GB2312区间最右端

            i = 25;

        }

        return initialtable[i]; // 在码表区间中,返回首字母

    }

    /**

     * 取出汉字的编码 cn 汉字

     */

    private static int gbValue(char ch) {// 将一个汉字(GB2312)转换为十进制表示。

        String str = new String();

        str += ch;

        try {

            byte[] bytes = str.getBytes("GB2312");

            if (bytes.length  2) {

                return 0;

            }

            return (bytes[0]  8  0xff00) + (bytes[1]  0xff);

        } catch (Exception e) {

            return 0;

        }

    }

}

java获得汉字的大写字母,其他字符不变

看看是不是你要的效果!

/**

* 根据汉字提取该汉字的首字母

* @author Administrator

*

*/

public class StringUtil {

// 国标码和区位码转换常量

static final int GB_SP_DIFF = 160;

// 存放国标一级汉字不同读音的起始区位码

static final int[] secPosValueList = { 1601, 1637, 1833, 2078, 2274, 2302,

2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858, 4027,

4086, 4390, 4558, 4684, 4925, 5249, 5600 };

// 存放国标一级汉字不同读音的起始区位码对应读音

static final char[] firstLetter = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H',

'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'W', 'X',

'Y', 'Z' };

// 获取一个字符串的拼音码

public static String getFirstLetter(String oriStr) {

String str = oriStr.toLowerCase();

StringBuffer buffer = new StringBuffer();

char ch;

char[] temp;

for (int i = 0; i str.length(); i++) { // 依次处理str中每个字符

ch = str.charAt(i);

temp = new char[] {ch};

byte[] uniCode = new String(temp).getBytes();

if (uniCode[0] 128 uniCode[0] 0) { // 非汉字

buffer.append(temp);

} else {

buffer.append(convert(uniCode));

}

}

return buffer.toString();

}

/**

* 获取一个汉字的拼音首字母。 GB码两个字节分别减去160,转换成10进制码组合就可以得到区位码

* 例如汉字“你”的GB码是0xC4/0xE3,分别减去0xA0(160)就是0x24/0x43

* 0x24转成10进制就是36,0x43是67,那么它的区位码就是3667,在对照表中读音为‘n’

*/

static char convert(byte[] bytes) {

char result = '-';

int secPosValue = 0;

int i;

for (i = 0; i bytes.length; i++) {

bytes[i] -= GB_SP_DIFF;

}

secPosValue = bytes[0] * 100 + bytes[1];

for (i = 0; i 23; i++) {

if (secPosValue = secPosValueList[i]

secPosValue secPosValueList[i + 1]) {

result = firstLetter[i];

break;

}

}

return result;

}

public static void main(String[] args) {

System.out.println(":"+StringUtil.getFirstLetter("哈哈123#$bc成功!!!!"));

}

}

有什么疑问可以百度HI我,加点分哦!

java中根据一段字符串,获取其中的字母,有要求;求个具体代码

要求1中要去掉所有数字,要求2、3中又要保留数字并进行翻译,所以我两种都写了。具体代码为:

public class Test {

public static void main(String args[]) {

String str = "0as2sw$#3Six";

System.out.println("原字符串:[" + str + "]");

System.out.println("");

//不翻译数字

SetString set1 = new LinkedHashSet();

for (String s : str.split("[^A-Z a-z]")) {

if (s.length() 0) {

set1.add(s);

}

}

System.out.println("不翻译数字的结果:" + set1);

System.out.println("");

     /*因为又要去除非字母和数字(以下简称去杂),又要将去杂结果分离成数字和字母,再翻译数字,整个流程挺麻烦的,索性在去杂之前,先将数字翻译成英文,为了使数字翻译后的英文和原字符串的字母分开,在数字左右添加占位符#,这样的话,形如:[a1b2c3]就会被处理为:[a#one#b#two#c#three#],这样去杂后,就会被分割为:[a,one,b,two,c,three]了。这里定义了枚举值English,用于实现0-9的英文映射,[10]不好映射成[ten],现在只能映射为[one,zero],如果按照题干非要映射为ten的话你再考虑考虑吧*/

for (English english : English.values()) {

str = str.replaceAll(english.getNum() + "", "#" + english.name() + "#");

}

System.out.println("将数字替换为“占位符 + 英文 + 占位符”的中间结果:[" + str + "]");

System.out.println("");

     //翻译数字的结果

SetString set2 = new LinkedHashSet();

for (String s : str.split("[^A-Za-z]")) {

if (s.length() 0  ) {

//判断当前字符串是否是数字的英文,如果不是,就把它拆成单字母

if (mappingEnglish(s)){

set2.add(s);

}else {

for (char c : s.toCharArray()) {

set2.add(String.valueOf(c));

}

}

}

}

System.out.println("翻译数字的结果:" + set2);

}

 //判断当前字符串是否是数字的英文

private static boolean mappingEnglish(String str) {

for (English english : English.values()) {

str = str.toLowerCase();

if (english.name().equals(str)) {

return true;

}

}

return false;

}

 enum English {

zero(0),

one(1),

two(2),

three(3),

four(4),

five(5),

six(6),

seven(7),

eight(8),

nine(9);

private int num;

public int getNum() {

return num;

}

English(int num) {

this.num = num;

}

}

}

我怕发出来代码又挤在一起,顺便也截个图:

8-21行

22-50行

51-61行

62-85行完

运行结果:

java语言中如何获取字符串中汉字的个数

【实例描述】

字符串中可以包含数字,字母、汉字或者其他字符。使用Character类的isDigit()方法可以判断字符中的某个字符是否为数字,使用Character类的isLetter()方法可以判断字符中的某个字符是否为字母。实例中将介绍一种方法用来判断字符串中的某个字符是否为汉字,通过此方法可以计算字符串中汉字的数量。实例的运行效果如图4.24所示。

【实现过程】

在Eclipse中新建项目ChineseCharacter,并在其中创建一个ChineseCharacter.java文件。在该类的主方法中创建标准输入流的扫描器对象,接收用户输入的字符串。我们在程序中使用matches()方法来统计该字符串中汉字的个数。核心代码如下所示:

protectedvoiddo_button_actionPerformed(ActionEvente){Stringtext=chineseArea.getText();//获取用户输入intamount=0;//创建汉字数量计数器for(inti=0;itext.length();i++){//遍历字符串每一个字符//使用正则表达式判断字符是否属于汉字编码booleanmatches=Pattern.matches("^[\u4E00-\u9FA5]{0,}$",""+text.charAt(i));if(matches){//如果是汉字amount++;//累加计数器}}umField.setText(amount+"");//在文本框显示汉字数量}

【代码解析】

本实例的关键点在于正则表达式的使用。Java提供了Pattern用于正则表达式的编译表示形式,该类提供的静态方法matches()可以执行正则表达式的匹配。该方法编译给定正则表达式并尝试给定输入与其匹配。如果要匹配的字符序列与正则表达式匹配则返回true,否则返回false。其声明语法如下:

publicstaticbooleanmatches(Stringregex,CharSequenceinput);【知识扩展】

使用正则表达式可以方便地进行字符串操作,正则表达式经常被用来验证用户输入的信息,如可以判断用户输入的格式是否正确。本实例中使用正则表达式来判断用户输入的字符串是否为汉字,如果为汉字则计数器加1,最后得到字符串中所有汉字的数量。

java取中汉子字母的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于java取汉字首字母、java取中汉子字母的信息别忘了在本站进行查找喔。

The End

发布于:2022-12-12,除非注明,否则均为首码项目网原创文章,转载请注明出处。