Вопросы к Поиску с Алисой
Составные символы в кодировке Юникод — это визуальные единицы («графемы»), состоящие из нескольких кодовых точек Юникода. stackoverflow.com
Составные символы могут быть представлены в виде построенной по определённым правилам последовательности кодов или в виде единого символа. script-coding.com
Например, символ «á» может быть представлен как последовательность базового символа «a» (U+0061) и модифицирующего символа « ́» (U+0301) или как монолитный символ «á» (U+00C1). web.archive.org
Составные символы можно разложить для согласованности или анализа. habr.com Например, при сортировке имён по алфавиту символ «ü» можно разложить на «u», за которым следует несамостоятельный знак «¨». habr.com После такой декомпозиции алгоритму проще работать с последовательностью символов. habr.com
Стандарт Юникод устанавливает порядок декомпозиции для всех составных символов и определяет формы нормализации для обеспечения уникальных представлений символов. habr.com