获取字符串长度与字符串个数 utf8 gb2312
//先定义2个函数 //判断如果不是UTF-8格式编码,则转换成UTF-8格式 function charset($data){ if( !empty($data) ){ $fileType = mb_detect_encoding($data , array("UTF-8","GBK","LATIN1","BIG5")) ; if( $fileType != "UTF-8"){ $data = mb_convert_encoding($data ,"utf-8" , $fileType); } } return $data; } // 计算中文字符串长度(utf-8) function getnum($str) { preg_match_all("/[0-9]{1}/",$str,$arrNum); preg_match_all("/[a-zA-Z]{1}/",$str,$arrAl); preg_match_all("/([x{4e00}-x{9fa5}]){1}/u",$str,$arrCh); $num1 = count($arrNum[0]); //数字个数 $num2 = count($arrAl[0]); //字母个数 $num3 = count($arrCh[0]); //中文个数 $sum = $num1 + $num2 + $num3; return $sum; }
//比较: //UTF-8 $str = "我是中国人111aaa"; $strlen = strlen($str); $num = getnum($str); echo $strlen . "," . $num; //结果: 21,11 ,utf8编码strlen获取到的是字节大小
//GB2312 $str = "我是中国人111aaa"; $strlen = strlen($str); $num = getnum($str); echo $strlen . "," . $num; //结果: 16,6 ,gb2312编码strlen获取到的是字节数,getnum函数只能计算UTF8的中文字段长度,所以是得出0,结果为6,可以通过charset函数更改字符串编码 //或者用iconv(in_charset, out_charset, str)更改编码再去根据自己需求计算
声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。
- 上一篇: java web 登录后更新JSESSIONID
- 下一篇: array_unique(删掉相同值)