Некоторые основные кодировки символов, которые используются в современных базах данных, например в MySQL:
- UTF-8. 1 Широко используемая кодировка, поддерживает почти все символы стандарта Unicode. 1 UTF-8 обратно совместима с ASCII и может представлять любой символ из набора символов Unicode. 1
- Latin1 (ISO-8859-1). 1 Однобайтовая кодировка, поддерживает западноевропейские языки. 1 Совместима с набором символов ASCII и включает такие символы, как буквы с ударением и специальные символы. 1
- UTF-16. 1 Кодировка переменной длины, способная представлять все символы Unicode. 1 Для большинства символов используется два байта, но может использоваться четыре байта для символов за пределами базовой многоязычной плоскости (BMP). 1
- UTF-32. 1 Кодировка фиксированной длины, использующая четыре байта для каждого символа. 1 Может представлять все символы Юникода, но используется реже из-за больших требований к хранению. 1
- GB18030. 5 Отдельный стандарт, который применяется в Китайской Народной Республике для кодирования китайских иероглифов. 5 В кодировке GB18030 введенные данные могут иметь длину 1, 2 или 4 байт. 5