技术学院

php中str_split按字节还是字符分割_php多字节编码下mb_str_split正确使用方法

作者:看不見的法師2025-11-26 00:00:00

PHP中处理多字节字符串应使用mb_str_split而非str_split，因str_split按字节分割会导致中文乱码，而mb_str_split按字符分割并支持指定编码（如UTF-8），可正确拆分汉字；例如"你好世界"用mb_str_split以长度1分割得["你","好","世","界"]，以长度2分割得["你好","世界"]；需确保启用mbstring扩展并显式指定编码，或用preg_split('/./u', $str, -1, PREG_SPLIT_NO_EMPTY)替代。

PHP中的str_split函数是按字节进行分割的，而不是按字符。这在处理ASCII字符时没有问题，因为每个字符占一个字节。但在多字节编码（如UTF-8）下，中文、日文等字符通常占用2到4个字节，这时使用str_split会导致字符被截断，出现乱码。

str_split 在多字节编码下的问题

例如：

$chinese = "你好世界";
$result = str_split($chinese, 1);
print_r($result);

输出结果可能是类似：

Array
(
    [0] => ä
    [1] => ¿
    [2] => ¤
    ...
)

这是因为UTF-8中每个汉字占3个字节，str_split把每个字节当作独立单位拆开，造成乱码。

使用 mb_str_split 正确处理多字节字符串

PHP提供了mb_str_split函数专门用于多字节字符串的分割，它能按字符而非字节进行切割，支持指定字符编码。

语法：

mb_str_split(string $string, int $length = 1, ?string $encoding = null): array

$string：要分割的字符串
$length：每个片段包含的字符数，默认为1
$encoding：字符编码，如"UTF-8"，可省略（推荐显式指定）

正确用法示例：

$chinese = "你好世界";
$result = mb_str_split($chinese, 1, 'UTF-8');
print_r($result);

输出：

Array
(
    [0] => 你
    [1] => 好
    [2] => 世
    [3] => 界
)

如果想每两个字符一组：

$result = mb_str_split($chinese, 2, 'UTF-8');
print_r($result);

输出：

Array
(
[0] => 你好
[1] => 世界
)

注意事项与建议

确保服务器安装并启用了 PHP 的 mbstring 扩展，否则mb_str_split不可用
始终显式指定编码（如'UTF-8'），避免因默认编码不一致导致问题
处理用户输入、数据库读取或国际化内容时，优先使用多字节函数族（mb_*）
若环境不支持mb_str_split（如旧版本PHP），可用正则配合preg_split替代：

preg_split('//u', $string, -1, PREG_SPLIT_NO_EMPTY);

基本上就这些。关键点是：处理中文等多字节文本时，别用str_split，改用mb_str_split，并指定编码，就能避免乱码问题。不复杂但容易忽略。

上一篇丨

Win7壁纸怎么调整大小？

下一篇丨

Win7玩穿越火线的时候fps低怎么解决？

全国咨询热线： 400-8878-609

新闻资讯

技术学院

php中str_split按字节还是字符分割_php多字节编码下mb_str_split正确使用方法

str_split 在多字节编码下的问题

使用 mb_str_split 正确处理多字节字符串

注意事项与建议

联系我们