intl
PHP Manual

Класс Normalizer

(PHP 5 >= 5.3.0, PHP 7, PECL intl >= 1.0.0)

Введение

Нормализация - это процесс преобразования символов и их последовательностей в формальное представление более низкого уровня. Данный процесс крайне важен при сравнении строк при сортировке или при поиске, но также используется при сохранении текста, что бы быть уверенным в том, что он сохранился корректно.

Консорциум Unicode определил несколько форм нормализации, отражающих разные потребности приложений.:

  • Normalization Form D (NFD) - Каноническое разложение
  • Normalization Form C (NFC) - Каноническое разложение с последующей канонической сборкой
  • Normalization Form KD (NFKD) - Совместимое разложение
  • Normalization Form KC (NFKC) - Совместимое разложение с последующей канонической сборкой
Различные формы задаются в требованиях наборов преобразований текста. Преобразования вычисляются с алгоритма и набора файлов данных.

Обзор классов

Normalizer {
/* Методы */
public static bool isNormalized ( string $input [, int $form = Normalizer::FORM_C ] )
public static string normalize ( string $input [, int $form = Normalizer::FORM_C ] )
}

Предопределенные константы

Данные константы задают форму нормализации, используемую нормализатором:

Normalizer::FORM_C (integer)
Форма нормализации C (NFC) - Каноническое разложение, после которого каноническая сборка
Normalizer::FORM_D (integer)
Форма нормализации D (NFD) - Каноническое разложение
Normalizer::FORM_KC (integer)
Форма нормализации KC (NFKC) - Совместимое разложение, после которого каноническая сборка
Normalizer::FORM_KD (integer)
Форма нормализации KD (NFKD) - Совместимое разложение
Normalizer::NONE (integer)
Без разложения/сборки
Normalizer::OPTION_DEFAULT (integer)
Обычные настройки нормализации

Содержание


intl
PHP Manual