Вопросы с тегом «character-properties»

11
JavaScript + Юникод регулярные выражения
Как я могу использовать регулярные выражения с поддержкой Юникода в JavaScript? Например, должно быть что-то похожее на \wто, что может соответствовать любой кодовой точке в категории «Буквы или метки» (не только ASCII), и, надеюсь, иметь фильтры типа [[P *]] для пунктуации и т. Д.

3
Эквиваленты Unicode для \ w и \ b в регулярных выражениях Java?
Многие современные реализации регулярных выражений интерпретируют \wсокращение класса символов как «любую букву, цифру или соединительную пунктуацию» (обычно: подчеркивание). Таким образом, регулярное выражение , как \w+спички слова , как hello, élève, GOÄ_432или gefräßig. К сожалению, в Java нет. В Java \wограничено [A-Za-z0-9_]. Это, среди прочего, затрудняет сопоставление слов, подобных упомянутым выше. …

2
Python и регулярное выражение с Unicode
Мне нужно удалить некоторые символы Юникода из строки 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' Я точно знаю, что они здесь есть. Я старался: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ') но это не работает. Строка остается прежней. Что я делаю неправильно?
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.