Для обработки многобайтовых кодировок в PHP используется отдельное расширение по работе с многобайтовыми строками. 2 Оно добавляет множество функций для работы со строками, каждая из которых имеет префикс mb_
(multibyte). 25
Некоторые функции для работы с многобайтовыми кодировками в PHP:
- mbconvertcase — производит смену регистра символов в строке; 5
- mbconvertencoding — преобразует кодировку символов; 5
- mbdetectencoding — определяет кодировку символов; 5
- mbinternalencoding — установка или получение внутренней кодировки скрипта; 5
- mb_ord — получает кодовую точку символа; 5
- mb_split — разделяет строки в многобайтных кодировках, используя регулярное выражение; 15
- mb_strcut — получение части строки; 5
- mb_stripos — регистронезависимый поиск позиции первого вхождения одной строки в другую; 5
- mb_strlen — получает длину строки; 5
- mb_strpos — поиск позиции первого вхождения одной строки в другую; 5
- mb_strripos — поиск последнего вхождения одной строки в другую, нечувствительный к регистру; 5
- mb_strrpos — поиск позиции последнего вхождения одной строки в другую; 5
- mb_strstr — находит первое вхождение подстроки в строке; 5
- mb_strtolower — приведение строки к нижнему регистру; 15
- mb_strtoupper — приведение строки к верхнему регистру; 5
- mb_substr — возвращает часть строки. 5
Поскольку PHP в основе своей разработан для ISO-8859-1, некоторые многобайтовые кодировки плохо работают в PHP. 3 Важно устанавливать mbstring.internal_encoding
для кодировки, работающей с PHP. 3