Вопросы к Поиску с Алисой
Да, можно сделать так, чтобы в регулярных выражениях |w учитывал буквы разных языков. stackoverflow.com
Для этого можно использовать регулярное выражение [|p{L}]
. stackoverflow.com Оно содержит все символы, являющиеся буквами, из всех языков, в верхнем и нижнем регистре. stackoverflow.com Если нужно, чтобы принималось неограниченное количество букв из этого набора, следует использовать звёздочку после квадратных скобок, например: [|p{L}]*
. stackoverflow.com
Также можно явно перечислить каждую букву алфавита вместо диапазона. ru.stackoverflow.com Например, для выделения из текста русских и английских слов можно использовать выражение [a-z'а-яё]+(?![|p{L}|p{N}_])
. ru.stackoverflow.com
Важно учитывать, что возможность учёта букв разных языков зависит от реализации и набора символов. stackoverflow.com