Ручное разделение данных предполагает участие человека, в частности разметчиков данных и экспертов. 1 Первые выполняют разметку, вторые — проверяют её качество. 1 Задача эксперта заключается в валидации результата работы разметчиков: специалист смотрит, правильно ли выделены именованные сущности и границы, везде ли проставлены тэги и классы. 1 Далее эксперт сам исправляет найденные недочёты или отправляет их на доработку разметчикам. 1
Автоматическое разделение данных предполагает использование систем искусственного интеллекта, которые заботятся об аннотации данных. 2 Это достигается с помощью эвристических методов или моделей машинного обучения. 2 В эвристическом методе один набор данных проходит через серию предопределённых правил или условий для проверки конкретной метки. 2 Условия устанавливаются людьми. 2
Таким образом, главное отличие в том, что при ручном разделении данные обрабатываются человеком, а при автоматическом — с помощью систем искусственного интеллекта, при этом специалисты оценивают итоговый результат работы модели и корректируют его при необходимости. 12