Во многих языках символы могут выражаться одним байтом. Многобайтные коды
символов используются для выражения символов многих других языков.
mbstring разработано для работы с японскими символами. Однако многие функции
mbstring могут работать с иными кодировками, не только с японской.
Многобайтная кодировка символов представляет один символ несколькими последовательными байтами. Некоторые кодировки имеют shift(escape)-последовательности для начала/окончания строк многобайтных символов. Следовательно, многобайтная строка может быть разрушена при разделении и/или обсчёте, если не использовать метод надёжного кодирования многобайтных символов. Данный модуль предоставляет функции сохранения много байтных символов и другие вспомогательные функции, такие как функции конвертации.
Поскольку PHP в основе своей разработан для ISO-8859-1, некоторые многобайтные кодировки плохо работают в PHP. Следовательно, важно устанавливать mbstring.internal_encoding для кодировки, работающей с PHP.
Требования Кодировки Символов PHP4
побайтное кодирование
однобайтные символы находятся в диапазоне 00h-7fh, что совместимо с ASCII
многобайтное кодирование - вне диапазона 00h-7fh
Вот примеры внутренней кодировки символов, которые работают и НЕ работают с PHP.