Распознавание текста в PDF-файлах работает с помощью технологии OCR (оптическое распознавание символов). 14 Она позволяет преобразовывать изображения текста PDF-документа в редактируемый текстовый формат, который поддерживает возможность поиска текста в документе, его копирование и редактирование. 2
Распознавание текста осуществляется только в том случае, если в PDF-документе не установлен запрет на редактирование. 2
Некоторые параметры, которые можно настроить для распознавания текста в PDF-файлах:
- Диапазон страниц. 2 Указывает диапазон страниц, на которых необходимо произвести распознавание текста. 2
- Языки. 2 Указывает язык или языки распознаваемого текста. 2 Желательно выбирать минимальное количество вариантов, это ускорит распознавание. 2
- Шрифт. 2 Позволяет выбирать вариант шрифта, который будет использоваться при форматировании уже распознанного текста. 2
- Текст с возможностью поиска. 2 При выборе этой опции после завершения процедуры распознавания текст будет доступен для поиска и копирования. 2 Распознанный текст будет вставлен в документ как невидимый под своим изображением. 2
- Редактируемый текст. 2 При выборе этой опции после завершения процедуры распознавания текст будет доступен для редактирования. 2 Распознанный текст вставится поверх изображения с данным текстом, само изображение при этом затирается фоном. 2
Для распознавания текста в PDF-файлах можно использовать различные программы, например PDF Commander, Master PDF Editor или Wondershare PDFelement 123.