`

java 汉字转拼音

阅读更多
  汉字转成拼音如果自己实现起来有点麻烦,主要是怕有些汉字转不了,所以就准备使用一个开源的工具Pinyin4j.
      pinyin4j是一个支持将中文转换到拼音的Java开源类库,pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。pinyin4j的主页:http://pinyin4j.sourceforge.net/
      1. 支持简体中文和繁体中文字符;
      2. 支持转换到汉语拼音,通用拼音, 威妥玛拼音(威玛拼法), 注音符号第二式, 耶鲁拼法和国语罗马字;
      3. 支持多音字,即可以获取一个中文字符的多种发音;
      4. 支持多种字符串输出格式,比如支持Unicode格式的字符ü和声调符号(阴平 "ˉ",阳平"ˊ",上声"ˇ",去声"ˋ")的输出。

    为了方便大家使用,我将源文件和jar包一并放上来了,欢迎大家下载。
     废话少说,下面是我建立的一个通用类,有什么不足的地方希望大家指正。
Java代码 
package com.xyj.com.tool.util; 
 
import net.sourceforge.pinyin4j.PinyinHelper; 
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 
 
/**
* @className:PinyingUtil.java
* @classDescription:拼音操作工具类
* @author:xiayingjie
* @createTime:2010-10-21
*/ 
 
public class PinyingUtil { 
 
    /**
     * 将字符串转换成拼音数组
     * 
     * @param src
     * @return
     */ 
    public static String[] stringToPinyin(String src) { 
        return stringToPinyin(src, false, null); 
    } 
    /**
     * 将字符串转换成拼音数组
     * 
     * @param src
     * @return
     */ 
    public static String[] stringToPinyin(String src,String separator) { 
        return stringToPinyin(src, true, separator); 
    } 
 
    /**
     * 将字符串转换成拼音数组
     * 
     * @param src
     * @param isPolyphone
     *            是否查出多音字的所有拼音
     * @param separator
     *            多音字拼音之间的分隔符
     * @return
     */ 
    public static String[] stringToPinyin(String src, boolean isPolyphone, 
            String separator) { 
        // 判断字符串是否为空 
        if ("".equals(src) || null == src) { 
            return null; 
        } 
        char[] srcChar = src.toCharArray(); 
        int srcCount = srcChar.length; 
        String[] srcStr = new String[srcCount]; 
 
        for (int i = 0; i < srcCount; i++) { 
            srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator); 
        } 
        return srcStr; 
    } 
 
    /**
     * 将单个字符转换成拼音
     * 
     * @param src
     * @return
     */ 
    public static String charToPinyin(char src, boolean isPolyphone, 
            String separator) { 
        // 创建汉语拼音处理类 
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 
        // 输出设置,大小写,音标方式 
        defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 
 
        StringBuffer tempPinying = new StringBuffer(); 
         
 
        // 如果是中文 
        if (src > 128) { 
            try { 
                // 转换得出结果 
                String[] strs = PinyinHelper.toHanyuPinyinStringArray(src, 
                        defaultFormat); 
                 
                         
                // 是否查出多音字,默认是查出多音字的第一个字符 
                if (isPolyphone && null != separator) { 
                    for (int i = 0; i < strs.length; i++) { 
                        tempPinying.append(strs[i]); 
                        if (strs.length != (i + 1)) { 
                            // 多音字之间用特殊符号间隔起来 
                            tempPinying.append(separator); 
                        } 
                    } 
                } else { 
                    tempPinying.append(strs[0]); 
                } 
 
            } catch (BadHanyuPinyinOutputFormatCombination e) { 
                e.printStackTrace(); 
            } 
        } else { 
            tempPinying.append(src); 
        } 
 
        return tempPinying.toString(); 
 
    } 
 
     
    public static String hanziToPinyin(String hanzi){ 
        return hanziToPinyin(hanzi," "); 
    } 
    /**
     * 将汉字转换成拼音
     * @param hanzi
     * @param separator
     * @return
     */ 
    public static String hanziToPinyin(String hanzi,String separator){ 
            // 创建汉语拼音处理类 
            HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 
            // 输出设置,大小写,音标方式 
            defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
            defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 
             
            String pinyingStr=""; 
            try { 
                pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator); 
            } catch (BadHanyuPinyinOutputFormatCombination e) { 
                // TODO Auto-generated catch block 
                e.printStackTrace(); 
            }    
            return pinyingStr; 
    } 
    /**
     * 将字符串数组转换成字符串
     * @param str 
     * @param separator 各个字符串之间的分隔符
     * @return
     */ 
    public static String stringArrayToString(String[] str, String separator) { 
        StringBuffer sb = new StringBuffer(); 
        for (int i = 0; i < str.length; i++) { 
            sb.append(str[i]); 
            if (str.length != (i + 1)) { 
                sb.append(separator); 
            } 
        } 
        return sb.toString(); 
    } 
    /**
     * 简单的将各个字符数组之间连接起来
     * @param str
     * @return
     */ 
    public  static String stringArrayToString(String[] str){ 
        return stringArrayToString(str,""); 
    } 
    /**
     * 将字符数组转换成字符串
     * @param str 
     * @param separator 各个字符串之间的分隔符
     * @return
     */ 
    public static String charArrayToString(char[] ch, String separator) { 
        StringBuffer sb = new StringBuffer(); 
        for (int i = 0; i < ch.length; i++) { 
            sb.append(ch[i]); 
            if (ch.length != (i + 1)) { 
                sb.append(separator); 
            } 
        } 
        return sb.toString(); 
    } 
     
    /**
     * 将字符数组转换成字符串
     * @param str 
     * @return
     */ 
    public static String charArrayToString(char[] ch) { 
        return charArrayToString(ch," "); 
    } 
 
    /**
     * 取汉字的首字母
     * @param src
     * @param isCapital 是否是大写
     * @return
     */ 
    public static char[]  getHeadByChar(char src,boolean isCapital){ 
        //如果不是汉字直接返回 
        if (src <= 128) { 
            return new char[]{src}; 
        } 
        //获取所有的拼音 
        String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src); 
        //创建返回对象 
        int polyphoneSize=pinyingStr.length; 
        char [] headChars=new char[polyphoneSize]; 
        int i=0; 
        //截取首字符 
        for(String s:pinyingStr){ 
            char headChar=s.charAt(0); 
            //首字母是否大写,默认是小写 
            if(isCapital){ 
                headChars[i]=Character.toUpperCase(headChar); 
             }else{ 
                headChars[i]=headChar; 
             } 
            i++; 
        } 
         
        return headChars; 
    } 
    /**
     * 取汉字的首字母(默认是大写)
     * @param src
     * @return
     */ 
    public static char[]  getHeadByChar(char src){ 
        return getHeadByChar(src,true); 
    } 
    /**
     * 查找字符串首字母
     * @param src 
     * @return
     */ 
    public  static String[] getHeadByString(String src){ 
        return getHeadByString( src, true); 
    } 
    /**
     * 查找字符串首字母
     * @param src 
     * @param isCapital 是否大写
     * @return
     */ 
    public  static String[] getHeadByString(String src,boolean isCapital){ 
        return getHeadByString( src, isCapital,null); 
    } 
    /**
     * 查找字符串首字母
     * @param src 
     * @param isCapital 是否大写
     * @param separator 分隔符
     * @return
     */ 
    public  static String[] getHeadByString(String src,boolean isCapital,String separator){ 
        char[]chars=src.toCharArray(); 
        String[] headString=new String[chars.length]; 
        int i=0; 
        for(char ch:chars){ 
             
            char[]chs=getHeadByChar(ch,isCapital); 
            StringBuffer sb=new StringBuffer(); 
            if(null!=separator){ 
                int j=1; 
                 
                for(char ch1:chs){ 
                    sb.append(ch1); 
                    if(j!=chs.length){ 
                        sb.append(separator); 
                    } 
                    j++; 
                } 
            }else{ 
                sb.append(chs[0]); 
            } 
            headString[i]=sb.toString(); 
            i++; 
        } 
        return headString; 
    } 
     
    public static void main(String[] args) { 
        System.out.println(stringArrayToString(getHeadByString("我se 心"))); 
    } 
 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics