入门客AI创业平台(我带你入门,你带我飞行)
博文笔记

如何实现按字节截取字符串(中文占2字节,英文占1字节,substring())?

创建时间:2012-02-21 投稿人: 浏览次数:98

str = "我a智能abc"

substring(str, 5) 会截取成为 “我a智能a”

现在要实现中文占2字节,英文占1字节,按字节截取 ,输出应该为"我a智"



public class SubString{
	
	/**
	*
	*/
	public static int trimGBK(byte[] buf,int n){
		int num = 0;
		boolean bChineseFirstHalf = false;
		for(int i=0; i<n; i++){
			if(buf[i]<0 && !bChineseFirstHalf){ //是中文的情况,num不用++
				bChineseFirstHalf = true;
			}else{
				num++;
				bChineseFirstHalf = false;
			}
			
		}
		return num;
	}
	
	public static void main(String[] args){
		String str = "我a智能abc";
		try{
			//使用给定的 charset 将此 String 编码到 byte 序列,并将结果存储到新的 byte 数组。
			int num = trimGBK(str.getBytes("GBK"),5); 
			System.out.println(str.substring(0,num)); //输出"我a智"
		}catch(Exception e){
			e.printStackTrace();
		}
	
		//System.out.println(str.substring(0,5)); //输出"我a智能a"
	}
}

/*
String str = "我a智能abc";
for(int i=0; i<str.getBytes("GBK").length; i++){
	System.out.println(str.getBytes("GBK")[i]);
}
输出:-50 -46 97 -42 -57 - 60 -36 97 98 99
中文是两个负数,英文是1个正数
*/


声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。