ICU (Международные компоненты для Юникода) помогает в обработке текстов на разных языках и кодировках с помощью различных функций, среди которых:
- Преобразование кодовых страниц. 1 ICU позволяет преобразовывать текстовые данные в Юникод или из него, а также практически в любую другую кодировку. 1 Таблицы преобразования основаны на данных наборов символов, собранных IBM в течение многих десятилетий. 1
- Параметры сортировки. 1 ICU сравнивает строки в соответствии с соглашениями и стандартами определённого языка, региона или страны. 1 Параметры сортировки основаны на алгоритме сортировки Юникод, а также на правилах сравнения для конкретного языкового стандарта. 1
- Форматирование. 1 ICU форматирует числа, даты, время и денежные суммы в соответствии с соглашениями выбранного языкового стандарта. 1 Сюда входит перевод названий месяцев и дней на выбранный язык, выбор соответствующих сокращений, правильное упорядочивание полей и т. д.. 1
- Вычисления времени. 1 ICU предоставляет несколько типов календарей за пределами традиционных григорианских, а также подробный набор API вычислений часовых поясов. 1
- Поддержка Юникода. 1 ICU обеспечивает простой доступ ко всем свойствам символов Юникода, нормализации Юникода, свертыванию регистра и другим фундаментальным операциям, указанным в стандарте Юникода. 1
- Регулярные выражения. 1 Регулярные выражения ICU полностью поддерживают Юникод, обеспечивая при этом высокую конкурентоспособность. 1
- Bidi. 1 ICU поддерживает обработку текста, содержащего смесь данных слева направо (английский) и справа налево (арабский или иврит). 1
- Анализ границ в тексте. 2 ICU позволяет определять позиции слов, предложений, абзацев в тексте. 2