Некоторые способы определения собственных имён в тексте:
- Графематический анализ. 1 Имена собственные, оформленные кавычками, можно отделить от слов, взятых в кавычки со смысловой целью, и от прямой речи. 1 При этом имена собственные в кавычках пишутся с заглавной буквы (хотя бы первое слово) и не имеют перед знаком кавычек двоеточия, а после знака кавычек — тире. 1
- Составление отдельного словаря. 1 Нужно просмотреть весь текст, выбрать все словоформы в середине предложения с большой буквы и составить отдельный словарь. 1 Затем проверить по тексту, встречаются ли данные формы со строчной буквы, и выявить случаи омонимии. 1 После этого через этот подсловарик проверить все слова в начале предложений. 1
- Использование списка известных имён собственных. 2 Нужно поработать со списком известных имён собственных (названия городов, собственные имена, фамилии) и предположить, что если найдены два или более из них, разделённых только пробелами, то это составное существительное. 2
Также для определения собственных имён в тексте можно использовать специальные программы и сервисы, например, Open Calais. 2