Smarty内置的truncate 截取中文出现乱码

作者:袖梨 2022-06-25

为了前端的美观,我用Smarty内置的truncate函数进行字符长度控制,比如有些文章的标题太长了,并且实际上它没有必要完全显示出来。用truncate是可以截取,比如说是这样:

 代码如下 复制代码
{$articleTitle|truncate:11:"...":true}

但是如果标题为中文,那么就很容易出现乱码!这是因为Smarty的truncate截取的是字符(占一个字节),但是如果是中文,例如UTF-8(占3个字节),那么在截取的时候这里的参数11是字节数,如果是中文,则它实际上是截取3个汉字(9个字节),剩下的2字节不能表示一个汉字,那么它就会以乱码的形式显示出来!


从网上找了一个解决办法,还是不错的:

 代码如下 复制代码

function smarty_modifier_truncate_utf($string, $length = 80, $etc = '...')

{
 $result = '';
 $string = html_entity_decode(trim(strip_tags($string)), ENT_QUOTES, 'utf-8');
 for($i = 0, $j = 0; $i < strlen($string); $i++)
 {
  if($j >= $length)
  {
   for($x = 0, $y = 0; $x < strlen($etc); $x++)
   {
    if($number = strpos(str_pad(decbin(ord(substr($string, $i, 1))), 8, '0', STR_PAD_LEFT), '0'))
    {
     $x += $number - 1;
     $y++;
    }
    else
    {
     $y += 0.5;
    }
   }
   $length -= $y;
   break;
  }
  if($number = strpos(str_pad(decbin(ord(substr($string, $i, 1))), 8, '0', STR_PAD_LEFT), '0'))
  {
   $i += $number - 1;
   $j++;
  }
  else
  {
   $j += 0.5;
  }
 }
 for($i = 0; (($i < strlen($string)) && ($length > 0)); $i++)
 {
  if($number = strpos(str_pad(decbin(ord(substr($string, $i, 1))), 8, '0', STR_PAD_LEFT), '0'))
  {
   if($length < 1.0)
   {
    break;
   }
   $result .= substr($string, $i, $number);
   $length -= 1.0;
   $i += $number - 1;
  }
  else
  {
   $result .= substr($string, $i, 1);
   $length -= 0.5;
  }
 }
 $result = htmlentities($result, ENT_QUOTES, 'utf-8');
 if($i < strlen($string))
 {
  $result .= $etc;
 }
 return $result;
}
?>

其实原理很简单,就是每次从字符串中取出一个字符(这个包括英文字母、符号、汉字等等),然后将其转为ASCII码,至于为什么要转为ASCII码,因为每个字符对应于唯一的一个ASCII码,而且其分布还是有规律的,比如说任意的一个汉字的ASCII码都大于255。这样我们就可以对字符进行处理了,如果当前字符为英文字母或者是可打印的符号(ASCII值从0~254),那么截取长度+1,如果当前字符为汉字(ASCII值>255),那么截取长度就+3(UTF-8下)。这样循环结束后也就知道了实际需要截取的是多少个字节数了!

    忘了说了,将上面的函数写到modifier.truncate_utf.php这个文件中,然后将其放在smarty的plugins目录下,调用的时候:

 代码如下 复制代码

<{$topic|truncate_utf:11:"..."}>

相关文章

精彩推荐