入门客AI创业平台(我带你入门,你带我飞行)
博文笔记

php多字节编码字符长度检测

创建时间:2015-07-13 投稿人: 浏览次数:130
/**
 *@bkInfo   1、 GB2312编码用两个字节(8位2进制)表示一个汉字
 *           2、 GBK采用双字节表示,总体编码范围为8140-FEFE
 *           3、 Big5在台湾、香港与澳门地区,使用的是繁体中文字符集,
 *            1984年,台湾五大厂商宏碁、神通、佳佳、零壹以及大众一同制定了一种繁体中文编码方案,
 *            因其来源被称为五大码,英文写作Big5,每个字符统一使用两个字节存储表示
 *           4、UTF-8对中文支持是一个汉字占3个字节
 * @author   caifangjie
 * @date     2015-07-13
 * @desc  多字节长度检测
 *  
 */
function mbLength($str)
{
    $len = strlen($str);
    $currentEncoding = strtolower(mb_detect_encoding($str));
    $i=0;
    for(;$i<$len;) {
        //判断是否为多字节
        if(ord(substr($str, $i, 1)) > 0xa0) {
            if($currentEncoding == "utf-8") {
                $i=$i+3;
            } else if(in_array($currentEncoding,array("gbk", "gb2312", "big5"))) {
                $i=$i+2;
            }
        } else {
           $i++;
        }
    }
    return $i;
}

声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。