Проблемы при обработке CSV-данных, содержащих запятые и переносы строк, могут возникать по нескольким причинам:
- Разные программы используют разные разделители. taurion.ru Например, в русской и других локалях запятая по умолчанию зарезервирована под десятичный разделитель. ru.wikipedia.org Если программа открывает CSV неправильно, данные могут «сливаться» в одну колонку. taurion.ru
- Для представления разрывов строк используются разные символы. support.microsoft.com В некоторых системах, например Mac или Unix, для этого применяют только управляющий символ перевода строки (LF). support.microsoft.com Другие системы могут использовать управляющие символы разрыва совершенно другой строки. support.microsoft.com
- Данные не заключены в кавычки. ru.wikipedia.org По стандарту RFC 4180, если поле содержит запятые, переносы строк, двойные кавычки, то это поле должно быть заключено в двойные кавычки. ru.wikipedia.org Если этого не сделать, то данные невозможно будет корректно обработать. ru.wikipedia.org
Чтобы избежать проблем, рекомендуется использовать правильную кодировку, проверять её перед импортом, а также сохранять файлы в UTF-8. taurion.ru