Возможно, имелись в виду различия между парсингом MHTML и HTML в контексте форматов веб-страниц.
HTML — это стандартный формат веб-страниц, для которого парсинг подразумевает, в частности, извлечение текстового содержимого страниц и поиск конкретных данных из полученного текста. 3
MHTML (сокращённо MIME HTML) — это формат архива веб-страниц, который позволяет объединять внешние ссылки (например, изображения, Flash-анимацию, Java-аплеты, аудио-файлы) вместе с кодом HTML в одном файле. 1 Парсинг MHTML, в свою очередь, может включать извлечение из такого документа, помимо текста, ещё и изображений. 2
Таким образом, основное отличие заключается в том, что парсинг HTML ориентирован на работу с текстовым содержимым страниц, а парсинг MHTML — на извлечение из одного файла различных ресурсов и кода HTML.