В кодировке Unicode важно соблюдать определённые правила при написании текста, потому что некорректная кодировка может привести к ошибкам при обработке текста. 2
Некоторые причины, по которым нужно учитывать следующие правила:
- Логический порядок символов. 1 В строке они записываются приблизительно в порядке прочтения, в том числе в двунаправленном письме. 1 Например, арабский текст кодируется справа налево, а оказавшееся в нём европейское число — слева направо. 1
- Правильная маркировка языка. 12 В Unicode разные начертания одного и того же символа зависят от языка. 12 Нужно следить, чтобы текст всегда был правильно помечен как относящийся к тому или другому языку. 1
- Отсутствие правил оформления. 3 Задача Unicode — передать смысл текста, а не его внешний вид. 3 Это значит, что в кодировке нет правил оформления или выделения слов цветом. 3