PHP截取utf-8字符串的具体方法介绍

开发 后端
UTF-8编码的字符可能由1~3个字节组成,我们在这里将为大家具体讲解有关PHP截取utf-8字符串的方法,希望对大家有所帮助。

我们对PHP语言都已经不再陌生,它是一个很常用的语言。今天我们将向大家介绍的是有关PHP截取utf-8字符串的相关方法。为了支持多语言,数据库里的字符串可能保存为UTF-8编码,在网站开发中可能需要用php截取字符串的一部分。为了避免出现乱码现象,编写如下的UTF-8字符串截取函数。

#t#关于utf-8的原理请看 UTF-8 FAQ

UTF-8编码的字符可能由1~3个字节组成, 具体数目可以由第一个字节判断出来。(理论上可能更长,但这里假设不超过3个字节)
第一个字节大于224的,它与它之后的2个字节一起组成一个UTF-8字符
第一个字节大于192小于224的,它与它之后的1个字节组成一个UTF-8字符
否则第一个字节本身就是一个英文字符(包括数字和一小部分标点符号)。

以前为某网站设计的代码(也是现在用在首页的长度截取的函数)

PHP截取utf-8字符串的代码示例:

  1. < ?php // Cut_Str;  
  2. //$sourcestr 是要处理的字符串  
  3. //$cutlength 为截取的长度(即字数)  
  4. function cut_str($sourcestr,$cutlength)  
  5. {  
  6. $returnstr=”;  
  7. $i=0;  
  8. $n=0;  
  9. $str_length=strlen($sourcestr);//字符串的字节数  
  10. while (($n<$cutlength) and ($i<=$str_length))  
  11. {  
  12. $temp_str=substr($sourcestr,$i,1);  
  13. $ascnum=Ord($temp_str);//得到字符串中第$i位字符的ascii码  
  14. if ($ascnum>=224) //如果ASCII位高与224,  
  15. {  
  16. $returnstr=$returnstr.substr($sourcestr,$i,3); 
    //根据UTF-8编码规范,将3个连续的字符计为单个字符  
  17. $i=$i+3; //实际Byte计为3  
  18. $n++; //字串长度计1  
  19. }  
  20. elseif ($ascnum>=192) //如果ASCII位高与192,  
  21. {  
  22. $returnstr=$returnstr.substr($sourcestr,$i,2);
     //根据UTF-8编码规范,将2个连续的字符计为单个字符  
  23. $i=$i+2; //实际Byte计为2  
  24. $n++; //字串长度计1  
  25. }  
  26. elseif ($ascnum>=65 && $ascnum<=90) 
    //如果是大写字母,  
  27. {  
  28. $returnstr=$returnstr.substr($sourcestr,$i,1);  
  29. $i=$i+1; //实际的Byte数仍计1个  
  30. $n++; //但考虑整体美观,大写字母计成一个高位字符  
  31. }  
  32. else //其他情况下,包括小写字母和半角标点符号,  
  33. {  
  34. $returnstr=$returnstr.substr($sourcestr,$i,1);  
  35. $i=$i+1; //实际的Byte数计1个  
  36. $n=$n+0.5; //小写字母和半角标点等与半个高位字符宽…  
  37. }  
  38. }  
  39. if ($str_length>$cutlength){  
  40. $returnstr = $returnstr . “…”;
    //超过长度时在尾处加上省略号  
  41. }  
  42. return $returnstr;  

以上就是PHP截取utf-8字符串的相关方法总结,希望对大家有所帮助。

责任编辑:曹凯 来源: 百度博客
相关推荐

2009-12-01 09:52:40

PHP过滤字符串

2009-11-26 16:26:32

PHP字符串mbstr

2009-11-23 15:10:28

PHP获取当前url

2010-03-11 09:56:57

Python字符串操作

2009-11-30 11:24:49

PHP将EXCEL导入

2009-11-30 18:26:06

PHP字符串替换

2009-11-24 17:25:00

PHP二维数组排序

2009-11-26 16:43:11

PHP截取中文字符串

2016-12-13 10:13:18

PHPUTF-8实践

2010-04-27 12:26:21

Unix字符串

2009-12-16 15:04:26

Ruby实现strea

2009-12-31 15:05:00

Silverlight

2009-12-31 14:12:40

Silverlight

2009-12-03 18:23:23

2009-12-01 13:41:49

静态路由设置

2009-12-01 09:18:50

PHP分割字符串

2009-06-30 14:16:37

截取字符串

2009-11-18 18:02:19

PHP字符串截取

2010-11-26 11:34:32

MySQL截取字符串函

2009-11-25 17:14:45

PHP安装为Apach
点赞
收藏

51CTO技术栈公众号