Некоторые причины снижения качества данных при секвенировании длинных последовательностей:
- Мотив-специфичные ошибки. 2 Это ошибки определения оснований, связанные с конкретными паттернами последовательностей. 2 Они характерны для повторяющихся или сложных мотивов, таких как гомополимеры и специфические триплеты. 2
- Неравномерное включение нуклеотидов или нестабильность флуоресцентного сигнала. 2 Если определённый триплет вызывает эти процессы, это приводит к высокой частоте ошибок на этих участках. 2
- Влияние состава реагентов для секвенирования. 2 Например, участки с высоким GC-составом и небольшими повторяющимися мотивами затрудняют секвенирование с использованием некоторых реагентов. 2
- Сложность структуры ДНК. 5 Например, длинные участки повторяющейся ДНК часто не учитываются, неправильно отображаются и собираются всеми платформами. 5
- Снижение скорости транслокации. 1 Скорость сдвига основания за основанием нуклеиновой кислоты через пору обычно снижается на поздних стадиях выполнения секвенирования, что негативно влияет на качество. 1
Чтобы минимизировать влияние ошибок на результаты секвенирования, используют фильтрацию и коррекцию данных, а также дополнительные технологии, например, объединение данных коротких и длинных ридов. 2