Вопросы к Поиску с Алисой
Разница между кодировками CP1251 и UTF-8 заключается в используемом наборе символов. www.cyberforum.ru dwweb.ru
CP1251 — это стандартная 8-битная кодировка для всех русских версий Microsoft Windows. www.cyberforum.ru dwweb.ru Она содержит практически все символы, использующиеся в русской типографике для обычного текста, а также символы для близких к русскому языку языков: украинского, белорусского, сербского и болгарского. www.cyberforum.ru
UTF-8 — это кодировка, реализующая представление Юникода, совместимое с 8-битным кодированием текста. www.cyberforum.ru dwweb.ru Она позволяет работать одновременно с несколькими языками, то есть выдавать тексты, в которых используются символы разных алфавитов и даже иероглифы. www.cyberforum.ru
Кроме того, UTF-8 — это многобайтовая кодировка, а CP1251 — однобайтовая. dwweb.ru То есть символ в UTF-8 может кодироваться несколькими байтами, а для русского языка, например, символ занимает 2 байта. www.cyberforum.ru