们经常会用到了解字符串长度的时候,在PHP里,可以使用strlen()函数来实现。使用方法如下:
PHP strlen() 函数定义和用法
strlen() 函数返回字符串的长度。
语法
strlen(string)
参数:string
描述:必需。规定要检查的字符串。
实例
代码如下 | 复制代码 |
echo strlen("Hello world!"); |
输出:12
那么对于中文怎么处理
PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:
$
代码如下 | 复制代码 |
enStr = ‘Hello,China!’; echo strlen($enStr); // 输出:12 |
而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。
gbk编码下每个中文字符所占字节为2,例:
代码如下 | 复制代码 |
$zhStr = ‘您好,中国!’; |
utf-8编码下每个中文字符所占字节为3,例:
代码如下 | 复制代码 |
$zhStr = ‘您好,中国!’; |
那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。
这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):
代码如下 | 复制代码 |
$zhStr = ‘您好,中国!’;
// 计算中文字符串长度
echo utf8_strlen($zhStr); // 输出:6 |
下面是补充:准确计算字符个数和计算字节数的区别
代码如下 | 复制代码 |
/假设当前页面编码为GBK $str="中国abc"; echo strlen($str); //返回7,因为 GBK编码每个中文两个字节,strlen是返回字符串所占的字节长度。 echo " "; echo iconv_strlen($str,"GBK"); //返回5.iconv_strlen 是统计字符串的字符数量 ?> 或者这么写 $biaoti="中华人民共和国"; $zijie=strlen($biaoti); echo $zijie." "; // 换行 ?> //假设当前页面编码为UTF-8 $str="中国abc"; echo strlen($str); //返回9,因为 UTF-8编码每个中文三个字节,strlen是返回字符串所占的字节长度。 echo " "; echo iconv_strlen($str,"UTF-8"); //返回5.iconv_strlen 是统计字符串的字符数量 ?> iconv_strlen 是无论是何种编码,均能计算准确字符个数。 //假设当前页面编码为GBK $str="中国abc"; echo strlen($str); //返回7,因为 GBK编码每个中文两个字节,strlen是返回字符串所占的字节长度。 echo " "; echo iconv_strlen($str,"GBK"); //返回5.iconv_strlen 是统计字符串的字符数量 ?> //假设当前页面编码为UTF-8 $str="中国abc"; echo strlen($str); //返回9,因为 UTF-8编码每个中文三个字节,strlen是返回字符串所占的字节长度。 echo " "; echo iconv_strlen($str,"UTF-8"); //返回5.iconv_strlen 是统计字符串的字符数量 ?> |
iconv_strlen 是无论是何种编码,均能计算准确字符个数。